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Prólogo 


Oh, do not ask, ‘What is it?” 
Let us go and make our visit. 
T. S. Eliot. 


STAS SON LAS NOTAS de los cursos de Álgebra Lineal que he enseñado en la Licencia- 
tura en Matemáticas de la UAM-I en años recientes. Los prerequisitos son mínimos: 
la asignatura de Estructuras Numéricas es más que suficiente. La idea fundamental del 
curso es el estudio de la matemática alrededor del problema de resolver sistemas de ecua- 
ciones lineales. El libro comienza motivado por ésto y avanza introduciendo las ideas y 
métodos necesarios para entender el algoritmo usual para resolver sistemas de ecuaciones, 
el método de eliminación gaussiana. Este es un curso para estudiantes de matemáticas 
y, aunque es elemental, todos los resultados y métodos se justifican. No es un curso de 
recetas, por el contrario, es un estudio de algunas de las ideas necesarias para entender 
el problema considerado. En cada momento se enfatizan los conceptos y su relación con 
el problema de resolver sistemas de ecuaciones. En el capítulo 3, usando todas las herra- 
mientas introducidas previamente, se estudia el método de Gauss para resolver sistemas 
de ecuaciones, justificando el conjunto de conceptos e ideas que tuvieron que introducirse 
en los dos capítulos anteriores. La segunda parte del libro es un estudio elemental de los 
operadores lineales en un espacio vectorial de dimensión finita y abarca desde el capítulo 
4 donde se introduce la noción de determinante de una matriz, generalizando los casos 
2x2y3x 3 ya conocidos desde otros cursos, para probar todas las propiedades de los 
determinantes que se usarán en los capítulos 5 y 6 donde se estudian formas especiales de 
algunos operadores lineales: diagonalizables, triangulables, en forma canónica de Jordan 
o en forma canónica racional, todas ellos de importancia capital en la matemática. En la 
tercera parte del libro se introducen estructuras especiales en los espacios vectoriales: pro- 
ductos internos y productos hermitianos en el capítulo 7, para después estudiar aquellos 
operadores lineales que tienen ciertas simetrías con respecto al los productos internos o 
hermitianos considerados, en particular se obtienen criterios para la diagonalizabilidad de 
algunos de estos operadores culminando con la demostración de los teoremas espectrales 
correspondientes. En el capítulo 9 se hace un estudio elemental de funciones y formas bili- 
neales, en especial formas cuadráticas, para terminar con una aplicación a la geometría de 
cónicas en R? y cuádricas en R3. El capítulo 10 es una introducción al álgebra multilineal. 
Al lector o lectora de estas notas, se le invita a escribir al autor, a la dirección electróni- 
ca: £fzCfxanum.uam.mx con cualquier sugerencia, críticas, correcciones tipográficas o 
de estilo. 
Puedes guardar o imprimir una copia de estas notas para tu uso personal, si así lo 
deseas. El autor se reserva los derechos sobre la presentación y organización de los temas. 


Capítulo 1 


Espacios vectoriales 


E LAS ECUACIONES QUE HEMOS ESTUDIADO HASTA AHORA, las más sencillas son 
D ecuaciones en una variable, por ejemplo del estilo ax = b. En forma natural uno 
puede considerar ecuaciones en más de una variable y las más simples de ellas son las 
ecuaciones polinomiales de primer grado, a las que llamaremos ecuaciones lineales. Por 
ejemplo, en una variable son de la forma ax = b; en dos variables son ecuaciones de la 
forma ax + by = c; en tres variables son ecuaciones de la forma ax + by + cz = d. 
En general, si tenemos n variables z1, ..., £n, una ecuación lineal en n variables es una 
igualdad de la forma 


(x) 0121 +: + anEn = b 


con los coeficientes a1,...,a, y el término independiente b elementos de un campo K 
(por ejemplo, Q, R, C ó Z/pZ). La pregunta importante, en este contexto, es ¿qué valores 
de las variables son soluciones de (x)?, es decir, ¿qué valores de las variables zj = a; € K 
son tales que al substituirlos en (*) la convierten en una igualdad en el campo K? Veamos 
unos ejemplos: 


Ejemplo 1. Para la ecuación 2x + 3y = 5, si ponemos x = 1, y = 1, se tiene que 2(1) + 
3(1) = 5 es una igualdad verdadera (digamos, en el campo R). Diremos entonces que 
x = 1, y = 1 son una solución de la ecuación 2x + 3y = 5. Observe que pueden existir 
mas soluciones, por ejemplo x = 10, y = —5 es una solución ya que 2(10) + 3(-5) = 
20 — 15 = 5. Note también que si intercambiamos los valores de x y y, poniendo x = —5, 
y = 10, ya no se tiene una solución ya que 2(—5) +3(10) = —10+ 30 = 20 # 5. El punto 
aquí es que una solución de 2x + 3y = 5 es un par ordenado (xo, yo) de elementos del 
campo K (en nuestro ejemplo K = R) tal que 2x0 + 3Yo = 5. Así, (10, —5) es solución 
de 2x + 3y = 5, pero (—5, 10) no lo es. Resumiendo, las soluciones de 2x + 3y = 5 son 
pares ordenados (o, Yo) ER x R. 


Ejemplo 2. En forma análoga, si consideramos una ecuación de la forma (x) en tres varia- 
bles, digamos con coeficientes reales: 
2x — 3y + 5z = 10 
y nos preguntamos por sus soluciones, observe que x = 3, y = 2, z = 2 es una solución 
de la ecuación anterior, ya que 
2(3) — 3(2) + 5(2) = 10. 
Así, la terna ordenada (3,2,2) es una solución de 2x — 3y + 5z = 10, pero (2,3,2) no lo 
es ya que 
2(2) — 3(3) + 5(2) = 5 # 10. 
Es decir, las soluciones de 2x — 3y + 5z = 10 son ternas ordenadas de números reales 
(Zo, Yo, 20). 


2 1. ESPACIOS VECTORIALES 


Las observaciones hechas en los ejemplos anteriores se pueden resumir, en el caso 
general, como sigue: para la ecuación lineal 


(x) 0121 +: + antn = b, 


si los coeficientes a; y el término independiente b son números reales y si queremos solu- 
ciones reales, entonces el conjunto de soluciones S de (*) es un subconjunto de Rx---xR 
(n factores). Y, en general, si los números ay, b pertenecen a un campo K y si queremos so- 
luciones con valores en K, entonces el conjunto de soluciones S de (*) es un subconjunto 
de 


n veces 


AAA 
Kx. xK. 


La pregunta importante en este contexto es: ¿cómo encontrar todas las soluciones de 
una ecuación lineal de la forma (*)? y, para comenzar, ¿cómo sabemos si una ecuación de 
la forma (*) tiene o no soluciones? 

En los capítulos siguientes desarrollaremos métodos para responder a las dos pregun- 
tas anteriores y comenzamos, en la sección siguiente, planteando el problema anterior en 
un contexto un poco más general. 


1.1. Sistemas de ecuaciones lineales 


Hemos considerado ecuaciones lineales de la forma 


(x) 0121 +: + antn = b, 
M veces 


AAA 
y vimos que sus soluciones son un subconjunto S del producto cartesiano K x---x K al 
que denotaremos por K”. Ahora, además de considerar una sola ecuación lineal a, 11 + 
-+> + an£n = b, podemos considerar dos o más tales ecuaciones. Por ejemplo, podemos 
considerar dos ecuaciones, con coeficientes en R, de la forma 


2r+3y = 5 
4x — 2y = 6 


y preguntarnos por las soluciones (pares ordenados de R?) que sean solución simultánea 
de la primera y de la segunda ecuación. En el ejemplo anterior, (1,1) es solución de la 
primera ecuación ya que 2(1) + 3(1) = 5, pero no lo es de la segunda ecuación ya que 
4(1) — 2(1) = 2 4 6. Similarmente, (3,3) es solución de la segunda ecuación pero no 
lo es de la primera. Observe ahora que el par ordenado (7/4, 1/2) es solución de ambas 
ecuaciones ya que 


2(7/4)+3(1/2) = 
4(7/4) -2(1/2) = 


El ejemplo anterior muestra que algunas soluciones de una ecuación no tienen por 
qué ser soluciones de la otra y que puede haber soluciones que lo sean de ambas ecuacio- 
nes. 

En este marco general, estudiaremos el problema de encontrar todas las soluciones de 
un conjunto de m ecuaciones lineales en n variables de la forma (x), requiriendo que las 
soluciones lo sean de todas las ecuaciones dadas. Diremos en este caso que tenemos un 
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sistema de m ecuaciones lineales en n incógnitas y usaremos la notación siguiente para 
denotar a un tal sistema: 


01121 + 41232 +: + ainn = b 
49171 + 2222 +:** + Ann = bə 
Am1T1 + am2£2 +:**+UmnTn = bm 


donde los coeficientes aij y los términos independientes b; son elementos de un campo K. 
Recordemos que las soluciones buscadas son n-adas ordenadas (x1,..., £n), es decir, son 


m veces 


AAA 
elementos de K” := K x... x K. 

Antes de comenzar a buscar soluciones de un sistema de ecuaciones como el anterior, 
debemos preguntarnos si estas soluciones existen ya que puede suceder que el conjunto 
de soluciones de uno de estos sistemas sea el conjunto vacío. Por ejemplo, más adelante 
veremos que el sistema de ecuaciones 


2r+3y = 5 
4x +6y = 


no tiene soluciones. Si la lectora o lector recuerda su curso de geometría, podrá reconocer 
por qué el sistema anterior no tiene soluciones, por ejemplo recordando que el conjunto de 
soluciones en R? de una ecuación de la forma ax + by = c representa una recta £ en R?: 


4 L£ 


y que las dos rectas del sistema anterior son paralelas distintas. 

Conviene entonces, para comenzar, considerar sistemas de ecuaciones lineales de los 
cuales sepamos que siempre tienen soluciones. Algunos de estos sistemas son aquellos de 
la forma: 


01171 T 0122 T tt T Alntn = 
092181 T 0222 T *** T A2nn = 
amit + am2%2 +`: +amnin = 0 


donde todos los términos independientes son b; = 0. Llamaremos homogéneos a estos 
sistemas de ecuaciones y observamos que siempre tienen la solución (0,...,0) € K”. 
Así, el conjunto Sp C K” de soluciones de un sistema homogéneo es no vacío ya que 
contiene al elemento 0 = (0,...,0) € K”. Supongamos ahora que u = (u1,..., Un) y 
v = (v1, ..., Un) son dos elementos de S}, i.e., son soluciones del sistema de ecuaciones 


4 1. ESPACIOS VECTORIALES 


homogéneo. Entonces, substituyendo los u, en el sistema de ecuaciones se obtienen las 
igualdades 


(1) 0/14] + aizu +:** + ainun =0 paral<i<m 
y similarmente, substituyendo los v; se obtienen las igualdades 
(2) 05101 + Qj2U2 + :** + ainun =0 paral <i<m. 
Observe ahora que si definimos la suma de las n-adas u y v componente a componente: 
u +v := (u1,..., Un) +(01,...,0n) = (u1 + 01,..., Un + Un) 


esta n-ada también es un elemento de K” ya que cada componente uj + vj € K porque 
el campo K es cerrado bajo sumas. Se tiene además que u + v también es solución del 
sistema homogéneo dado ya que 


aj (ur +01) + Ojo (us + v2) +: + Ginl[Un + Un) = (aiu +: + ainun) 
+ (0,101 +-:**+GinUn) 


por (1) y (2). 
Hemos mostrado así que el conjunto Sp de soluciones de un sistema de ecuaciones 
homogéneo es cerrado bajo sumas. 
También, si u = (u¡,uz,...,Un) E€ Sh y AE K es cualquier elemento del campo K, 
entonces definiendo 
A-u:= (Mu, Auz,..., Auy,) 


observamos que À- u € K” ya que cada Au; € K porque el campo K es cerrado bajo 
productos. Se tiene además que Au sigue siendo una solución del sistema homogéneo ya 
que 


aj (Au) + aja (Aus) +e ain(Aun) = A(a;1U1 + 04949 +: + Ain Un) = A(0) =0 


factorizando a A y usando (1). 

Hemos mostrado así que el conjunto Sp de soluciones de un sistema de ecuaciones 
homogéneo es cerrado bajo productos por elementos del campo K. De ahora en adelante 
a los elementos de un campo K los llamaremos escalares. 

Resumiendo, si Sp C K” es el conjunto de soluciones de un sistema de ecuaciones 
lineales homogéneas, hemos probado que S» satisface: 


(1). S, contiene al elemento D € K”. 
(2). Sp es cerrado bajo sumas componente a componente. 
(3). Sp es cerrado bajo producto por escalares. 

Nótese cómo en la demostración de las propiedades anteriores se usó fuertemente 
el hecho de que los términos independientes de las ecuaciones lineales del sistema sean 0, 
porque este número satisface que 0+0 = 0 y 1-0 = 0 en K. Si algún término independiente 


no fuera 0 el conjunto de soluciones no sería cerrado bajo ninguna de las dos operaciones 
anteriores e incluso podría ser vacío como observamos en un ejemplo previo. 


En el caso de un sistema homogéneo, el conjunto S» satisface las propiedades extras 
siguientes: 
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Proposición 1.1. El conjunto Sp C K” de soluciones de un sistema de ecuaciones ho- 
mogéneas, junto con las operaciones suma y producto por un escalar, satisface las propie- 
dades siguientes: 
(1) La suma es asociativa, es decir, si u,v, w E Sh, entonces 

u+ (v + w) = (u+ v) + w. 
(2) La suma es conmutativa, es decir, para todo u,v € Sn se tiene que 

u+v=v+u. 
(3) El elemento O € Sn es neutro aditivo, es decir, para cualquier u € Sy, se tiene que 
u+0=u. 

(4) Para cada elemento u € Spn existe un elemento u’ € S» tal que u+u! =0. Al elemento 
u’ se le llama un inverso aditivo del elemento u. 


El producto por un escalar del campo K y un elemento de Sn satisface: 


(5) Para cualesquiera u,v € Sn y À E€ K se tiene que 
Alu + v) = Au + Av. 


(6) Para cualesquiera u € Sh y A, y € K se tiene que 


(A+ yu=Au+ yu. 
(7) Para cualesquiera u € Sh y A, y € K se tiene que 
(A: yu=A- (yu). 
(8) Para todo u € S» y para el neutro multiplicativo 1 € K se tiene que 
l.u=u. 


DEMOSTRACIÓN. Probaremos algunas de las propiedades anteriores, dejando las otras 
como un ejercicio. Para (2), si u = (u1,..., Un) y V = (v1,...,0n) son dos elementos 
arbitrarios de Sp, entonces 


u+v = (u,...,Un) +(01,...,0n) 
= (u+01,...,U4n +n) por definición de suma en S» 
= (v +41,...,U, +Un) porque u; + vi = v; + u; en K 


= v+u por definición de suma en Sp. 


Para (3), si u = (u1, ..., Un) E Sh, entonces 
u+0 = (u,...,Un)+(0,...,0) 
= (u1 +0,..., Un +0) por definición de suma en S» 
= (u1,...,Un) porque u; + 0 = u; en K 
= u. 
Para (4), si u = (u1, ..., Un) E Sh, entonces el elemento 


u := (07,..., Un) 
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pertenece a Sp y además satisface que u + u’ = 0. En efecto, como u’ = (—1)u y como 
Sp es cerrado bajo multiplicación por escalares, entonces u’ € Sp. Ahora, 


utu = (uy,...,Un) + (-41,..., —Un) 
= (ur —U7,..., Un — Un) 
= (0,...,0) 
0. 


Para (6), si u = (u1,..., Un) E Sh y A, y € K, entonces 
(A+ y)u (A+ y (us, Un) 
(A+ yu, ..., (A+ Pun) 
(Aui + yuz,..., AUn + Yun) 
(Au1,..., Aun) + (YU1,. - -, Yun) 
àu + yu. 


EJERCICIO 1. Demuestre las propiedades (1), (5), (7) y (8) de la proposición anterior. 


El lector habrá notado que hasta ahora no hemos dado algún método para hallar solu- 
ciones (diferentes de la solución obvia 0) de un sistema homogéneo de ecuaciones lineales. 
Tan sólo hemos probado algunas propiedades del conjunto de soluciones de un tal sistema 
homogéneo. Por el momento tendremos que conformarnos con esto; más adelante desarro- 
llaremos un método general para hallar todas las soluciones de un sistema de ecuaciones 
lineales homogéneo o no y será hasta ese momento cuando las propiedades que acabamos 
de demostrar muestren su importancia debida. Así, después de pedir la confianza del lector 
en este punto, lo anterior sirva únicamente como motivación para el estudio de los conjun- 
tos V que satisfacen las mismas propiedades que S}. El lector notará sin embargo que el 
tema de las soluciones de sistemas de ecuaciones lineales estará siempre presente en los 
desarrollos que haremos y en algunos puntos lo haremos explícito cuando convenga. 


1.2. Espacios vectoriales 


En la sección anterior vimos cómo el conjunto Sy de soluciones de un sistema de 
ecuaciones lineales homogéneas es cerrado bajo sumas y producto por escalares del cam- 
po dado y además satisface las propiedades listadas en la proposición 1.1. En general exis- 
ten muchos conjuntos V que tienen operaciones como las del conjunto Sp y satisfacen 
propiedades análogas; en esta sección comenzamos su estudio. 


Definición 1.2. Si K es un campo (por ejemplo Q, R, C 6 Z/pZ con p primo), un espacio 
vectorial sobre K (6 K-espacio vectorial) es un conjunto no vacío V (cuyos elementos 
llamaremos vectores) junto con dos operaciones: 


SUMA DE VECTORES. Si u,v € V se tiene definido otro vector u + v € V y decimos que 
la operación suma es cerrada. 


PRODUCTO DE UN ESCALAR POR UN VECTOR. Si u € V y A € K se tiene definido otro 
vector A-u € V. 


Y se requiere que estas operaciones satisfagan las propiedades siguientes: 
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(1) La suma es asociativa, es decir, si u, v, w € V, entonces 
u+(v+w)=(u+0) +w. 
(2) La suma es conmutativa, es decir, para todo u,v € V se tiene que 
u+v=v+u. 


(3) Existe un neutro aditivo, es decir, existe un elemento Oy € V tal que para cualquier 
u € V se tiene que 

u+0y =u. 
(4) Para cada elemento u € V existe un elemento u’ € V tal que u+u* = Oy. Al elemento 
u’ se le llama un inverso aditivo del elemento u. 


El producto por un escalar del campo K y un elemento de V satisface: 


(5) Para cualesquiera u,v € V y A € K se tiene que 
Alu + v) = Au + Av. 
(6) Para cualesquiera u € V y A, y € K se tiene que 


A+ yu=Au+ yu. 
(7) Para cualesquiera u € V y A, y € K se tiene que 
(Ayu =à: (yu). 
(8) Para todo u € V y para el neutro multiplicativo 1 € K se tiene que 
l.u=u. 


Ejemplo 3. Con esta terminología, el conjunto Sp de soluciones de un sistema de ecuacio- 
nes lineales homogéneas es un K-espacio vectorial. 


Ejemplo 4. Si K es un campo y 


n veces 


aAa 
Vi=K"=Kx-.xK, 


los elementos de V son todas las n-adas ordenadas u = (a1, ... , an) con entradas a; € K. 
Recuerde que dos n-adas ordenadas u = (a1,..., an) y v = (b1,...,d,) de V = K” son 
iguales, denotado u = v, si y sólo si aj = bj para todas las j =1,...,n. 


I. En V = K” se define una suma mediante la regla 
u+v=(a1,...,dp)+(b1,...,bdp) := (a, +b1,...,An +0), 


observando que, como aj + bj € K, entonces u + v € V, es decir, la suma anterior es 
cerrada en V. 


II. En V = K” se define el producto por un escalar mediante la regla siguiente: si A € K 
y u = (aj,...,adp) € V, se define 


A:u=A-(a1,...,4,) := (Auz,..., Aun) 


observando que, como Aa; € K, entonces Au € V. 


EJERCICIO 2. Verifique que V = K”, con las operaciones anteriores, es un H-espacio 
vectorial. 
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Ejemplo 5. Si K es cualquier campo y V = KlTx] es el conjunto de polinomios en una 
variable x, con coeficientes en K, los elementos de V = KTx] son las expresiones de la 
forma 

f = f(x) = ao + aiz + 0927 +--+ ama” 
con los a; € K y m > 0 un entero. Recuerde que dos polinomios f(x) = ay + az + 
a22?+--*+4m 1” y g(x) = bo + b11 + b22?+---+b,x” son iguales, denotado f = g, 
si y sólo si m = n y aj = bj para cada j. 


I. En V = K[zx] se tiene la suma usual de polinomios 
f+9:= (ao + bo) + (a1 +b1)2+ (az +b2)£? +--+ (ap + bp)" +- 


(sumando los coeficientes de los términos correspondientes) y observamos que a; +b; € K 
por lo que f + y € V = Kfz]. 


Il. Si f = ao +12 + aoz? +--+ ama” € V = Klx] y Ae K, se define A - f como 
A = Alao + a+ a22? +--+ amT™) = (Aao) + (Aa1)2 + (Aaz)? +--+ (Aam)e™ 
y se observa que, como Aa; € K, entonces A- f € V = Klz]. 


EJERCICIO 3. Verifique que V = K[x] es un K-espacio vectorial. 


Ejemplo 6. Para K = R pongamos 
V := {f : [a,b] > R : f es una función}, 
i.e., V es el conjunto de funciones del intervalo real [a, b] a la recta real R. 
En V se define una suma de funciones en la forma usual: si f,g € V se define la 
función f + g : [a,b] — R mediante la regla 
(F +g)(a) := f(a) + gla) paraa € a,b). 
También, si f € V y A € R, se define el producto à - f : [a,b] — R mediante la regla 


A- Pla) =à- fla) para a € [a,b]. 


EJERCICIO 4. Compruebe que el conjunto de funciones V anterior, con las operaciones 
definidas antes, es un R-espacio vectorial. 


Ejemplo 7. Si K = R, consideremos el conjunto 
V := {s:N >R : ses una función}, 


es decir, V es el conjunto de funciones con dominio los naturales y codominio los reales. 
Una función s : N — R se suele llamar una sucesión con valores reales. Dada una sucesión 
s : N — R, para cada natural n € N se tiene un único valor real s(n) € R. Es costumbre 
usar la notación sn := s(n) € R y a la sucesión s : N — R se le denota {sn | sobreenten- 
diendo su dominio, N, y su codominio, R. En el conjunto V de sucesiones reales se tiene 
la suma usual: si {an } y {bn } son dos elementos de V se define: 


{an} + {bn} := {an + bn}, 
y, si à € Ry {an} € V, se define 
A- {an} := {Aan}. 
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EJERCICIO 5. Demuestre que el conjunto de sucesiones reales V, con las operaciones 
anteriores, es un R-espacio vectorial. 


Ejemplo 8. (Matrices.) Este es un ejemplo muy importante: si K es cualquier campo y 
m,n E N son dos naturales dados, una matriz m x n con entradas en el campo K, es un 
arreglo rectangular de la forma: 


011 QZ JES Aln 
Q21 aq ct: 02n 
Am1 Am2 n Amn 


donde cada entrada a;; € K, para 1 <i <my1 < j < n. En una matriz m x n 
distinguiremos sus renglones y sus columnas: 


Columna C; 


q11 Qiz == a E ee Qin 
Q21 Q22 uv: Q2j `> 02m 
Renglón Ri —> Qil Qi? t Qij `t Qin 
Ami m2 *** Umj ““* Amn 


de tal forma que una matriz m x n tiene m renglones R;, 1 < i < m y n columnas Cj, 
1 < j < n, dados por 


Ri = (011/0194. , Qin) 


Umj 


Observe entonces que los renglones R; son vectores de K” y, salvo la notación, las 
columnas son vectores de K™. 

Usaremos letras mayúsculas como A, B, C para denotar a matrices m x n y, en 
ocasiones, usaremos la abreviación A = (aij)mxn para denotar una matriz m x n con 
entradas aij. 

Si A = (aij)mxn y B = (bij)mxn son dos matrices del mismo tamaño m x n, con 
entradas en el campo K, diremos que la matriz A es igual a la matriz B, denotado A = B, 
si y sólo si a¡¿ = b;j para todo i = 1,...,m y todo j = 1,...,n. Es decir, dos matrices 
son iguales si y sólo si entrada por entrada son iguales. 
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Denotaremos mediante Mat. xn (4H) al conjunto de matrices de tamaño m x n con 
entradas en el campo K. En este conjunto se tienen las operaciones: 


I. SUMA DE MATRICES. Si A = (aij)mxn y B = (bij)mxn son matrices en Mat xn(K), 
se define su suma mediante: 
sumando coeficiente a coeficiente. Es claro que A+ B € Mati xn (K), por lo que la suma 


es cerrada. 


II. PRODUCTO DE UN ESCALAR POR UNA MATRIZ. Si A = (arj)mxn es una matriz en 
Matmxn(K) y A € K es un escalar, se define A - A mediante: 
A: A= A(a;;) := (aij) 


multiplicando el escalar A por cada uno de los coeficientes de A. Es claro que AA € 
Matmxn(K). 


EJERCICIO 6. Demuestre que el conjunto de matrices Matmxn( K), con las operaciones 
anteriores, es un K-espacio vectorial. Nota: usaremos el símbolo 0 para denotar a la matriz 
m x n con todas sus entradas a¿¿ = 0 y la llamaremos la matriz cero. 


EJERCICIO 7. Sea V := {f : R — R : f es una función par} (recuerde que una f es una 
función par si y sólo si f(x) = f(—x) para todo x € R). Con la suma y producto por un 
escalar usuales (véase el ejemplo 6), demuestre que V es un R-espacio vectorial. 


EJERCICIO 8. Sean K = R y V = C” con la suma coordenada a coordenada y para un 
escalar A € R se define el producto por un vector de V = C” coordenada a coordenada. 
¿Es V un R-espacio vectorial? 


Propiedades elementales de los espacios vectoriales. Las primeras propiedades de los 
espacios vectoriales son aquellas que uno podría esperar: 


Lema 1.3 (Ley de cancelación para la suma). Si V es un K-espacio vectorial y u,v, w € V 
son tales que 


UFU=3UH+Y, 


entonces v = w. 


DEMOSTRACIÓN. Sea u’ € V un inverso aditivo de u (el cual existe por la propiedad 4 de 
la defición 1.2). Entonces, 


u+v=u+w=> u +(u+v) =u +(u+w) 
> (u +u) +v = (u +u)+w porasociatividad 


> 0y +v =0y +w ya que u' + u = 0y (un neutro aditivo) 


> v= Ww. 


Lema 1.4. Si V es un K-espacio vectorial, entonces: 
(1) El neutro aditivo de V es único. 


(2) Para cada u € V su inverso aditivo es único. 
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DEMOSTRACIÓN. (1) Supongamos que Oy y 0;, son dos neutros aditivos de V. Entonces, 
Oy =0y +01, ya que 0% es neutro aditivo 


=0y ya que Oy es neutro aditivo. 


(2) Sea u € V y supongamos que u’ y u” son ambos inversos aditivos de u. Entonces, 
u+u!=0y ya que u! es inverso aditivo de u 
=u+u” ya que u” es inverso aditivo de u, 


se sigue que u + u’ = u + u” y, por la ley de cancelación, esto último implica que u’ = 
1? 
a 


Al (único) inverso aditivo de u € V lo denotaremos mediante —u € V. 
Proposición 1.5. Sea V un K-espacio vectorial. Entonces, 
(1) A-0y = Oy, para cualquier A € K y el vector Oy € V. 


(2) 0-u=0, para el escalar O € K y cualquier u € V. Nota: en la igualdad anterior el 0 
en el lado izquierdo denota al escalar 0 € K y el 0 en el lado derecho es el vector 0y € V. 
Algunas veces denotaremos al vector Oy mediante un 0 y el contexto debe indicar cuál es 
el significado correcto y no debe causar confusión. 


(3) (—1)u = —u, para el escalar —1 € K y cualquier u € V. 
DEMOSTRACIÓN. (1)SiA€ K yO € V, 
A:0=A-(0+0) yaque 0 es neutro aditivo 
=A:0+A-0, 
y, por la ley de cancelación, esto último implica que A- 0 = 0. 
(Q2)SiueVy0E€K, 
0-u=(0+0)-u yaque0 € K es neutro aditivo 
=0-u+0-u, 
y, por la ley de cancelación, esto último implica que 0 - u = 0. 
(B6)SiueVy-1€kK, 
u+(-1)u=1.u+(-1):u yaquel-u=u 
=(1-1)-u 
=0-u 
=0 por la propiedad (2) anterior. 


Se sigue que u + (—1) - u = 0 y, por la unicidad del inverso aditivo de u, la igualdad 
anterior implica que (—1) - u = —u. 


EJERCICIO 9. Sea V un K-espacio vectorial. Si u € V y A € K, demuestre que 
(1) -u = à- (~u) =-—(A -u). 


EJERCICIO 10. Sea V un K-espacio vectorial. Si u,v € V son tales que u + v = v, 
demuestre que u = 0. 
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EJERCICIO 11. Sea V un K-espacio vectorial y sea A € K un escalar Æ 0. Si u € V es tal 
que À - u = 0, demuestre que u = 0. 


1.3. Subespacios vectoriales 


Al estudiar sistemas de m ecuaciones lineales homogéneas en n incógnitas con coe- 
ficientes, digamos en R, mostramos en 81.1 que el conjunto de soluciones Sy de un tal 
sistema es un ¡R-espacio vectorial contenido en R”. Por el ejemplo 4 de 81.2, se tiene que 
R” también es un R-espacio vectorial y las operaciones de S, y de R” son las mismas y 
tenemos así dos espacios vectoriales Sy C R” con las mismas operaciones. 


Definición 1.6. Si V es un K-espacio vectorial y W C V es un subconjunto, diremos que 
W es un subespacio vectorial de V si W es un K-espacio vectorial con las operaciones de 
V restringidas a W. 


Observe que, si W C V es un subespacio vectorial, en particular esto quiere decir 
que: 
(1) W debe contener al vector Oy de V, 
(ii) W es cerrado bajo la suma de vectores de V, 
(iii) W es cerrado bajo el producto por escalares de K, y 
(iv) para cada w € W su inverso aditivo —w también debe estar en W. 


Supongamos ahora que W C V es un subconjunto no vacío que satisface las condicio- 
nes (i), (11), (111) y (iv) anteriores. Observamos que W es un subespacio vectorial de V ya 
que todas las propiedades de espacio vectorial de V se heredan a W. Hemos así probado: 


Lema 1.7. Sean V un K-espacio vectorial y W C V un subconjunto no vacío. Entonces, 
W es un subespacio vectorial de V si y sólo si W satisface las condiciones (1), (11), (111) y 
(iv) anteriores. 


Observemos ahora que si W C V satisface las condiciones (1), (11), (111), entonces 
también satisface la condición (iv) ya que si w € W, entonces para el escalar —1 € K se 
tiene por (iii) que (—1) -w € W; pero por la proposición 1.5(3) se tiene que (—1)-w = —w 
y por lo tanto (iv) se satisface. Hemos así probado la simplificación siguiente del lema 
anterior: 


Lema 1.8. Sean V un K-espacio vectorial y W C V un subconjunto no vacío. Entonces, 
W es un subespacio vectorial de V si y sólo si W satisface las condiciones (1), (11) y (111) 
anteriores. 


Ejemplo 9. Si V es cualquier K-espacio vectorial, entonces el subconjunto W = {0y} € 
V es un subespacio vectorial. El subconjunto W = V C V también es un subespacio 
vectorial. 


Ejemplo 10. Si V = KT[x] es el espacio vectorial de polinomios en una variable con coe- 
ficientes en el campo K, sea P, (K) el subconjunto de V formado por los polinomios 
de grado < n, para n > 0 un entero fijo. Como el polinomio constante O tiene grado 
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gr(0) = —œ < n, entonces 0 € P (K). Claramente P, (K) es cerrado bajo sumas y 
producto por escalares. Se sigue que P,, (XK) es un subespacio de K [z]. 


Ejemplo 11. Si V = F((a, b], R) es el R-espacio vectorial de las funciones f : [a,b] — R 
y W = C([a, b], R) es el subconjunto de funciones continuas de [a, b] en R, entonces W es 
un subespacio vectorial de V ya que las funciones constantes son continuas (en particular, 
la función 0 es continua), la suma de funciones continuas es continua y el producto de un 
escalar real por una función continua es continua. 


Ejemplo 12. Si V = R?, podemos visualizarlo como el plano cartesiano: 


4 


>» W=ejeX 


y si W = eje X = [(a,0) : a € R}, se tiene que W es un subespacio vectorial de R°. 
Lo mismo es cierto para el eje Y. 


Matrices. Para poder dar ejemplos de subespacios del (importante) espacio vectorial de 
matrices Mat,» xn (K) necesitaremos algunas definiciones: 


(e)Una matriz A = (aij)mxn se dice que es una matriz cuadrada si m = n. 


(e) Dada una matriz cuadrada en Mat xn (K): 


Q11 Q12 Aln 

Q21 Q22 02n 
A= (arjnxn -= 

An1 an2 Sn Ann 


a las entradas de la forma a;; se les llama los elementos de la diagonal de A. 


(e) Una matriz cuadrada A = (aij)nxn se dice que es una matriz diagonal si todas sus 
entradas fuera de la diagonal son 0, i.e., si a;; = O siempre que i % j. Así, una matriz 
diagonal se ve como: 


011 0 cs 0 
0 022 0 yrs 0 
0 0 0433 0 0 
0 > 0 0 Ann 


Note que no estamos pidiendo que los elementos de la diagonal sean Æ 0, bien puede 
suceder que algunos o todos los elementos de la diagonal también sean 0. En particular, la 
matriz 0 € Mat, xn(K) es una matriz diagonal. 


(e) Una matriz cuadrada A = (aij)nxn se dice que es una matriz triangular superior si 
todas sus entradas abajo de la diagonal son 0, i.e., si a;; = O siempre que 1 > j. Así, una 
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matriz triangular superior se ve como: 


011 012 *** Qin 
O a2 ::: am 
0 0 an 


(e) Una matriz cuadrada A = (aij)nxn se dice que es una matriz triangular inferior si 
todas sus entradas arriba de la diagonal son 0, i.e., si a;; = O siempre que 2 < j. Así, una 
matriz triangular inferior se ve como: 


a11 0 0 

031 0492 0 0 

Ani An2 t Ann 

(e) Si 
411 012 din 
091 022 02n 
A= (arj)mxn a 

Ami Am2 Aat Amn 


mXN 
es una matriz m x n, su transpuesta, denotada *A es la matriz n x m que se obtiene 
intercambiando renglones y columnas de A, i.e., 


q11 Q21 *** Ami 
i Q12 Q22 *** Am2 
A= (Ajidnxm => 
din 02n ei Amn AXT 
Por ejemplo, si 
1 2 4 
(4305) 
-1 3 0 eS 
entonces 
1 -—1 
tA=| 2 3 
4 0 3x2 


(e) Una matriz cuadrada A = (aij)nxn se dice que es una matriz simétrica si es igual a 
su transpuesta, i.e., si ŻA = A. Es decir, si aij = aji para todas las entradas de A. Por 
ejemplo, la matriz 


1 0 1 
A=| 02 0 
1 0 3 


3x3 
es simétrica. 


EJERCICIO 12. Si V = Mataxn(K) y W C V es el subconjunto de las matrices diagona- 
les, demuestre que W es un subespacio vectorial de V. 
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EJERCICIO 13. Si V = Matnxn( K) y W C V es el subconjunto de las matrices triangu- 
lares superiores, demuestre que W es un subespacio vectorial de V. 


EJERCICIO 14. Si V = Matnxn( K) y W C V es el subconjunto de las matrices triangu- 
lares inferiores, demuestre que W es un subespacio vectorial de V. 


EJERCICIO 15. Si V = Mataxn(K) y W C V es el subconjunto de las matrices simétri- 
cas, demuestre que W es un subespacio vectorial de V. Nota: tendrá que probar que si 
A, B € Matnxn( K), entonces 

G) *(4+B)=*A4+*B. 


GD 14) = AČA), para toda A € K. 


(e) Si A = (aij)nxn es una matriz, su traza, denotada Tr( A), es la suma de los elementos 
de su diagonal. Es decir, 


Tr(A) = Tr(a;;) = 5 Qiii. 
i 
Note que la traza de una matriz es un escalar. 


EJERCICIO 16. Si V = Matnxn( K) y W C V es el subconjunto de todas las matrices 
cuya traza es 0, demuestre que W es un subespacio vectorial de V. 


EJERCICIO 17. Sea V = R? como R-espacio vectorial. Demuestre que los conjuntos 
siguientes son subespacios vectoriales de V: 
O W = {(z,y) ER? : 2=y). 
Gi W = {(x,y) ER? : -+y=0). 
üi W = {(z,y) ER? : 2+4y=0). 


EJERCICIO 18. Sea V = R? como R-espacio vectorial. Demuestre que los conjuntos 
siguientes son subespacios vectoriales de V: 


(1) W=((2,y,2) ER? : 2+y+2=0). 
(ii) W=((2,y,2) E R? : z=y€ 2y= 2). 
(ii) W=((2,y,2) ER? : x+y = 3z}. 


EJERCICIO 19. Sea V = Matnxn( K). Demuestre que el subconjunto W C V de matrices 
cuya diagonal consiste de ceros, es un subespacio vectorial de V. 


Operaciones con subespacios vectoriales. Dado un -espacio vectorial V, sus subespa- 
cios vectoriales son subconjuntos de V y así podemos considerar su intersección y su unión 
pensándolos como conjuntos. La pregunta natural en este contexto es: ¿dados W1, W2 su- 
bespacios vectoriales de V, será cierto que W1 N Wa ó W1 U W también son subespacios 
vectoriales de V? La respuesta es afirmativa en el caso de la intersección y negativa en 
general para la unión: 


Lema 1.9. Si V es un K-espacio vectorial y W,, Wa subespacios vectoriales de V, en- 
tonces Wı N Wa también es un subespacio vectorial de V. 
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DEMOSTRACIÓN. Como W, y W2 son subespacios de V, entonces Oy € W, N Wa. Si 
u,v € Wı N Wa, entonces por definición de intersección u,v € W1 y u,v € Wa, por lo 
que u+v € Wi y u+u € Wa ya que Wı y Wa son cerrados bajo la suma de vectores. 
Se sigue que u +v € Wı N W2. Similarmente, si w € W¡ N Wa, entonces w € W; y 
w € Wa y así, para cualquier escalar A se tiene que Aw € Wi y Aw € Wa ya que ambos 
son subespacios. Se sigue que Aw € W1 N Wa. 


EJERCICIO 20. Si W,,, para œ € I, es una familia de subespacios vectoriales de un K- 
espacio vectorial V, demuestre que 
N Wa 


aEl 
es un subespacio vectorial de V. 


Ejemplo 13. Si V = R?, W1 = eje X y Wa= eje Y son los subespacios vectoriales del 
ejemplo 12, entonces W1 UW consiste de los dos ejes coordenados de R?. Note ahora que 
W1 U W; no es cerrado bajo sumas de vectores, por ejemplo, si (2,0) € W1 y (0,3) € Wa 
se tiene que (2,0) + (0,3) = (2,3) W1 U W2. 


Suma de subespacios. Habiendo observado que la unión de subespacios en general no es 
un subespacio del espacio vectorial V dado y pensando en el ejemplo 13 anterior, es fácil 
notar que la unión de dos subespacios vectoriales contiene al vector Oy y es cerrado bajo 
el producto por escalares, siendo lo único que falla la cerradura bajo la suma de vectores. 
Entonces si agrandamos la unión W U W> añadiendo las sumas de vectores de la forma 
w1 + wa con wı € Wi y wa € Wa, debemos obtener un subespacio vectorial de V. La 
definición formal es como sigue: dados dos subespacios vectoriales Wı y Wa de V, se 
define el conjunto 


Wi + Wa := [w1 + wa : w E W1 y wa € Wa) 


notando que como w,,wa E V, entonces w + wa E V, por lo que Wi + Wa es un 
subconjunto de V. 


Lema 1.10. Sean W, y W2 subespacios vectoriales de V. Entonces, Wi + Wa es un 
subespacio vectorial de V y contiene a la unión W, U Wa. 


DEMOSTRACIÓN. Note que W, C W1 +W> ya que si w, € W1, entonces w, = w¡+0y € 
Wi + W2. Similarmente W2 C W1 + W2. Se sigue que W1 UW2 C W¡ + W2, en particular 
0y € Wı + W2. Probaremos que W; + Wa es cerrado bajo sumas. En efecto, si w, + w2 
y u1 + uz son dos elementos de W1 + W2, entonces 


(w1 + w2) + (u1 + u2) = (w + u1) + (wa + u2) 


con wı +u, € W1 y w2+u2 € Wa y así W1 + W2 es cerrado bajo sumas. Probaremos ahora 
que W + W., es cerrado bajo el producto de escalares: sean A € K y wı + wa € Wi + W2; 
entonces, 

A(w: + w2) = àw + àw € Wi + Wa 


ya que Awı € W1 y Awa € Wa porque estos son subespacios. 


Ejemplo 14. En V = R? considere los subespacios vectoriales siguientes: U el plano XY 
y W el plano Y Z, es decir, 


U = {(x,y,0) ER°} y W=((0,y,2) € R3}. 
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Entonces, R? = U + W ya que si v = (a,b, c) € R? es cualquier vector, 
v = (a,b,c) =(a,b,0)+(0,0,c) con (a,b,0) € U y (0,0,c) € W. 


Suma directa de subespacios. Note que, en el ejemplo anterior, la descomposición de v 
como suma de un vector de U y de un vector de W, en general, no es única; por ejemplo, 


v= (1,2,3) = (1,2,0)+(0,0,3) 
= (1,1,0) + (0,1,3). 


Proposición 1.11. Sea V un K-espacio vectorial y sean U,W subespacios de V. Enton- 
ces, todo elemento v € V se puede escribir en forma única como v = u + w conu € U y 
w € W si y sólo si se satisfacen las dos condiciones: 

Q U+W =V. 

Gi) UAW = {0y}. 


DEMOSTRACIÓN. Supongamos que (i) y (ii) son ciertas. Como V = U + W, entonces 
para todo v € V existen u € U y w € W tales que v = u + w. Supongamos ahora que 
se tiene otra descomposición de v como v = u’ + w' con u’ € U y w € W. Entonces, 
u+ w= u +w y así 

u— u =w — w, 


con u—u! € U y w'—w € W. La igualdad anterior nos dice que u— u’ = w'—w € W por 
lo que u—u! € W y asíu—u! € UNW = {0y}. Similarmente, w'—w € UNW = {0y}. 
Se sigue que u — u’ = 0y = w — w y por lo tanto u = u’ y w = vw”, i.e., las dos 
descomposiciones de v eran la misma. 

Supongamos ahora que todo vector v € V se puede escribir en forma única como 
v = u +w conu E€ U yw E W, entonces (1) se satisface. Para probar (11), supongamos 
que v € U N W. Entonces, v € U y v € W por lo que 


v = v+0y conveU y 0y € W 
= Oy+v cony eUyveW 
y como la descomposición de v debe ser única, se sigue que v = Oy, y por lo tanto 
UNW = {0y}. 


Definición 1.12. Sea V un K-espacio vectorial. Si U, W son subespacios de V tales que: 
Q U+W =V. 
Gi) UN W = {0y}, 

diremos que V es suma directa de los subespacios U y W, y lo denotaremos mediante 


V=U W. 


EJERCICIO 21. Sean V = K[x], U C V el conjunto de polinomios f(x) = ay + a17 + 
azz? +--+ anz” tales que a; = 0 para todos los índices i pares, y W C V el conjunto 
de polinomios g(x) = ay + ax + a91? +- + 472” tales que a; = 0 para todos los 
índices j impares. 

(i) Muestre que U y W son subespacios vectoriales de V. 

Gi) Demuestre que V = U 9 V. 


EJERCICIO 22. Recuerde que una matriz cuadrada A se dice que es simétrica si su trans- 
puesta es ella misma: tA = A. La matriz A se dice que es antisimétrica si *A = — A. 
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(1) Sean V = Matox2(K), U C V el subconjunto de matrices 2 x 2 simétricas y 
W C V el subconjunto de matrices antisimétricas. 
(a) Muestre que U y W son subespacios vectoriales de V. 
(b) Demuestre que V = U 9 W. 
(11) Sean V = Matnxn( K), U C V el subconjunto de matrices simétricas y W C V 
el subconjunto de matrices antisimétricas. 
(a) Muestre que U y W son subespacios vectoriales de V. 
(b) Demuestre que V = U 9 W. 


Sugerencia: si A € Maty, xn (LK), muestre que ¿(4 + +A) es simétrica. 


EJERCICIO 23. Sea V = Mata xn(K) y considere los subconjuntos 
U := { (aij) € Mataxn(K) : aj =0Vi > j} 


W := {(bi;) € Matnxn( K) ; bij =0Vi < SY. 
(i) Muestre que U y W son subespacios vectoriales de V. 
(ii) Demuestre que V = U 9 W. 


1.4. Combinaciones lineales 


Si en el R-espacio vectorial R? fijamos un vector u = (a,b, c) distinto de O y conside- 
ramos el conjunto de todos los múltiplos escalares de u: 
L:= {u : AER), 


este subconjunto es una línea recta en R3 que pasa por el origen en la dirección del vector 
u: 


y, de hecho, £ es un subespacio vectorial de R3, como se comprueba fácilmente. 


Si ahora consideramos dos vectores u y v en R3, digamos no colineales, y considera- 
mos el conjunto de todas las sumas de los múltiplos escalares de u y los múltiplos escalares 
de v: 

P := {u+ w : åy ER}, 
este subconjunto es un plano en R3 que pasa por el origen y contiene a los extremos de los 
vectores u y v: 
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y, de hecho, P es un subespacio vectorial de R?, como se comprueba fácilmente. 


Definición 1.13. Si V es un K-espacio vectorial y v1, ..., Un es un conjunto finito de 
vectores de V, una combinación lineal de los vectores v4, ..., Un es un vector de la forma: 


41U1 + a2V2 + ` +- + AnUn E V 


con escalares aj € K. 
Un vector v € V se dice que es combinación lineal de los vectores v1, ..., Un, SÍ 
existen escalares a,,...,a, en K tales que 


V = 01U1 + 09U2 + :** + Ay Un- 


Ejemplo 15. El vector Oy € V es combinación lineal de cualquier conjunto (finito) de 
vectores v1, ..., Un de V ya que 


0y =0-01+-:::+0:0,. 


Ejemplo 16. Si V = R? y vı = (1,0), vz = (1,1), entonces el vector u = (3,4) es 
combinación lineal de vı y vaz ya que 


u = (3,4) = —1 - (1,0) + 4- (1,1) = —1 -v1 +4- v2. 


Ejemplo 17. Si V = P„(K) es el espacio vectorial de los polinomios en una variable x, con 


coeficientes en un campo K y de grado < n, y si vo = 1, vı = 2, V2 a... Un = T” 
son vectores de P„ (K), entonces todo polinomio f(x) = ao +a2+a222+---+a, 2" € 
P,, (K) es combinación lineal de los vectores vo, ..., Un, ya que 


f)=a00:1+01-2+09:22+---+an q 


es la combinación lineal requerida, con los escalares los coeficientes aj del polinomio 
dado. 


Ejemplo 18. Si V = R? y e, = (1,0), ez = (0, 1), entonces todo vector u = (a,b) € R? 
es combinación lineal de e; y e2 ya que 


u = (a,b) =(a,0) + (0,b) =a-(1,0)+b-(0,1) =a-e, +b- ez. 


Sistemas de ecuaciones lineales y combinaciones lineales. Si consideramos un sistema 
de ecuaciones lineales, digamos con coeficientes en R, pero válido para cualquier campo 
K: 


01171 + 41232 +: + ainin = b 
49171 + a22%2 +: + a2nIn = ba 
Am1T1 + am2£2 +: +UmnTn = bm 


considerando los vectores columna (en R™ ó K””) dados por los coeficientes a;; del siste- 
ma anterior y el vector columna de los términos independientes b;: 
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011 a12 Ain bı 
a21 022 d2n ba 
Cı T A > Ca = k a 1 Cn TF : > b= 
Am1 Am2 Amn bm 
y pensando a las incógnitas x1, . . . , 1, como escalares de R (ó de K), en notación vectorial 


el sistema de ecuaciones anterior se puede escribir como 


a11 012 Cin bı 
0421 022 02n ba 
Tı: : + Za: . E co Zn : = : , 
Am1 Am2 Amn bm 
o, denotando a las columnas de coeficientes mediante C4, ..., Cn y a la columna de térmi- 


nos independientes por b, la combinación lineal anterior se puede escribir como 
(x) £101 + £202 +- + nOn =b 


y cuando nos preguntamos si el sistema de ecuaciones dado tiene o no soluciones, en térmi- 
nos de la combinación lineal (*) nos estamos preguntando si el vector columna de términos 
independientes b es o no combinación lineal de los vectores columna de coeficientes C4, 
..., Cn. Así, el problema de resolver un sistema de ecuaciones lineales se ha convertido 
en el problema de determinar cuándo un vector dado es o no combinación lineal de otros 
vectores dados, y los dos problemas son equivalentes. Conviene entonces saber quién es 
el subconjunto formado por todas las combinaciones lineales de los vectores C1, ..., Cn, 
para saber si el vector b pertenece o no a este conjunto. 

Antes de continuar, notemos que todavía no hemos encontrado un método para resol- 
ver sistemas de ecuaciones lineales, pero hemos reinterpretado el problema en un contexto 
que nos será útil para el procedimiento que daremos más adelante. 


Subespacios generados por un subconjunto de vectores. Al principio de esta sección 
vimos dos ejemplos en R? donde todas las combinaciones lineales de un vector (respecti- 
vamente, dos vectores) de R3 generaban un subespacio vectorial de R3, a saber, una línea 
recta £ (respectivamente, un plano P). Que esto es cierto en general es el contenido de la 
proposición siguiente: 


Proposición 1.14. Sean V un K-espacio vectorial y vı, ...,Un vectores dados de V. Si 
K(v1,..., Un) es el subconjunto de V dado por las todas las combinaciones lineales de 
los vectores v1, ..., Un: 


K(v1,..., Un) = [0101 +: + Ann : Qi EXE V, 
entonces K(v1,..., Un) es un subespacio vectorial de V. Al subespacio K (v1, ... , Un) se 


le llamará el subespacio generado por los vectores v1, .. ., Un. 


DEMOSTRACIÓN. El vector 0y € K(v1,..., Un) ya que Oy = 0v1 +- -- + Ovn. Ahora, si 
u E€ K(v1,..., Un), entonces u es de la forma u = 4101 +-+- + QU, y así, para A € K 
se tiene que 
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y por lo tanto Au € K(v1,..., Un). Finalmente, si u,w € K(v1,..., Un), entonces u y w 
son de la forma 


U = 0101 +: +0n0 Y w= 6101 +-**+ PnUn 


y así 
u+w= (010 +: + antn) + (6101 +--+ Brun) 
= (01 + B1)u1 +: + (An + Bn)Un 
con aj+8; E K, y por lo tanto u+w tiene la forma requerida y así u+w € K(v1,...,Un). 


De acuerdo a la interpretación que hicimos antes acerca de la solubilidad de un sistema 
de ecuaciones lineales, escrito en la forma 


(x) x1C1 + 2202 q aC =b 


con Cy los vectores columna del sistema y b el vector columna de los términos indepen- 
dientes, todos ellos elementos del espacio vectorial K”, la proposición anterior tiene la 
consecuencia inmediata siguiente: 


Corolario 1.15. El sistema de ecuaciones lineales 
(x) 1101 + £202 +--+ nOn =b 


tiene solución en K” si y sólo el vector columna b pertenece al subespacio vectorial 
K(C;,...,Ch) generado por los vectores columna de los coeficientes del sistema. 


La construcción anterior, del subespacio vectorial generado por un conjunto finito de 
vectores U1,..., Un, Se puede generalizar para considerar el subespacio generado por un 
subconjunto arbitrario de vectores de V: dado un subconjunto no vacío S C V, denotamos 
con K(S) al subconjunto de combinaciones lineales finitas de vectores de S, i.e., 


K(S) := {Aw ++ Agr ; Aj EK y W1,...,wW E S}. 


Observe que S C K(S) ya que cada w € S se puede escribir como la combinación 
lineal w = 1- w con w € S. Note que aún cuando S puede tener un número infinito 
de vectores, K(S) se define con combinaciones lineales de subconjuntos finitos de S. 
Consecuentemente, la demostración de la proposición anterior sigue siendo válida para 
K(S) y por lo tanto K(S) es un subespacio vectorial de V. Más aún, K(S) es el menor 
subespacio vectorial de V que contiene a S: 


Proposición 1.16. Si V es un K-espacio vectorial y S C V es cualquier subconjunto, 
entonces 
K(5S)= N W, 
SCWCV 
donde la intersección es sobre todos los subespacios vectoriales W de V que contienen a 


S. 


DEMOSTRACIÓN. Como K(S) es un subespacio vectorial que contiene a S, entonces 
K(S) es uno de los intersectandos y por lo tanto K(S) contiene a la intersección de la 
proposición. Recíprocamente, si W es un subespacio vectorial tal que S C W, entonces 
para cualquier elemento v = A1Ww1 ++-++Azwz de K(S), como los w; € S C W y como 
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W es subespacio vectorial, entonces W contiene a cualquier combinación lineal de ele- 
mentos de W, y por lo tanto v € W. Hemos así mostrado que K(5) C W para cualquier 


subespacio W que contiene a S. Se sigue que K(S) € A W, como se quería. 
SCWCV 


Definición 1.17. Si S C V es cualquier subconjunto no vacío, al subespacio vectorial 
K(S) de la proposición anterior se le llama el subespacio vectorial generado por S. 

Si S = (), se extiende la definición anterior poniendo K(0) := {0y }, el subespacio 
que consta sólo del vector cero. 


Ejemplo 19. Al principio de esta sección, para V = R?, vimos que el subespacio generado 
por un vector v Æ 0 es una recta que pasa por el origen: R(v) = £. También vimos que si 
u y v son dos vectores no colineales de R3, el subespacio generado por estos dos vectores 
es un plano que pasa por el origen: R(u, v) = P. 


Ejemplo 20. Si V = R? y e, = (1,0), ez = (0,1), en el ejemplo 18 vimos que el 
subespacio generado por e1 y ez es todo R?. 


Definición 1.18. Sea V un K-espacio vectorial. Si para un subconjunto S C V se tiene 
que K(S) = V, diremos que S genera al espacio vectorial V. También diremos que los 
vectores de S son generadores de V. 


Con esta definición, el ejemplo 20 nos dice que los vectores e, = (1,0) y e2 = (0, 1) 
generan R?. 


Ejemplo 21. Si V = R?, los vectores e, = (1,0,0), ez = (0,1,0), ez = (0,0,1) son 
generadores de R3. El argumento es similar al del ejemplo 20. 


Ejemplo 22. En general, en R”, los vectores e, = (1,0,...,0), e2 = (0,1,0,...),..., 
en = (0,...,0,1) (donde ez tiene un 1 en el lugar k y ceros en las otras componentes), 
generan R”. 


Ejemplo 23. Si V = Klx], los vectores 1,1,1?,...,1”,..., generan K[x] ya que todo 
polinomio f(x) = ay + az + agx? +--- + ang” es combinación lineal de algunos de 
los vectores 1,1,2?,...,x”,... usando los coeficientes de f(x) como los escalares de la 
combinación lineal, como en el ejemplo 17. 


Ejemplo 24. Los vectores vı = (1,0,0), v2 = (0,1,0) y v3 = (1,1,0) no generan a R?, 
ya que cualquier combinación lineal de ellos tiene la tercera coordenada igual a cero y por 
lo tanto ningún vector de R cuya tercera coordenada sea 4 0 es combinación lineal de 
U1, U2, V3. 


Ejemplo 25. Si V es cualquier K-espacio vectorial, el conjunto S = V genera a V ya que 
todo v € V se puede escribir como la combinación lineal v = 1 · v. 


EJERCICIO 24. Sea V un K-espacio vectorial. Si S C T son dos subconjuntos de V, 
demuestre que K(S) C K(T). 


EJERCICIO 25. Si S C V genera a V y T C V es otro conjunto tal que S C T, demuestre 
que T también genera a V. 


EJERCICIO 26. Si W es un subespacio vectorial de un K-espacio vectorial V, demuestre 
que K(W) = W. 
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EJERCICIO 27. Sea V = Mat2x2 (RR). Demuestre que las matrices siguientes generan a V: 
1 0 0 1 0 0 0 0 
001007110710 E 


EJERCICIO 28. Sea V = Pa(K') el espacio vectorial de los polinomios con coeficientes en 
un campo K y de grado < 2. Muestre que los polinomios 1, 1 + x, 1 + x + 27, generan a 
V. 


EJERCICIO 29. Si V es cualquier K-espacio vectorial, ¿cuál es el subespacio generado por 
S= 40472 


EJERCICIO 30. Si V = K (el campo K, considerado como K-espacio vectorial), muestre 
que 1 € K genera a V. ¿Puede dar otros subconjuntos que generan a V? Explique. 


EJERCICIO 31. Sea V = R?. 
G) Si U = R(2, 1) es el subespacio de V generado por (2,1) y W = R(0, 1) es el 
subespacio de V generado por (0, 1), demuestre que R? = U 9 W. 
Gi) Si U’ = R(1, 1) es el subespacio de V generado por (1, 1) y W” = R(1, 0) es el 
subespacio de V generado por (1,0), demuestre que R? = U’ 9 W”. 


EJERCICIO 32. Sea V = R. Sean U = R(1,0,0) el subespacio de V generado por 
(1,0,0) y W = R{(1, 1,0), (0, 1, 1)) el subespacio de V generado por (1, 1,0) y (0,1, 1). 
(1) Grafique estos subespacios. 
(ii) Demuestre que R? = U 9 W. 


1.5. Dependencia e independencia lineal 


El ejemplo 25 de la sección anterior nos dice que dado cualquier -espacio vectorial 
V, siempre hay un conjunto de generadores S de V, a saber S = V. El ejercicio 25 por su 
parte nos dice que si S genera al espacio V, entonces cualquier conjunto que contenga a 
S también genera a V; así, el problema no es agrandar un conjunto que genere a V, sino 
por el contrario, sabiendo que un conjunto S genera al espacio V, el problema es hallar 
el conjunto con el menor número de elementos que genere a V. Por ejemplo, quisiéramos 
hallar un subconjunto B C S tal que B siga generando a V pero que B sea mínimo en el 
sentido de que si le quitamos cualquier vector v € B, el conjunto diferencia B \ {v} ya 
no genera a V. Con esto en mente, consideremos lo que nos dice el ejercicio 25: si S E V 
genera a V y S C T C V, entonces T también genera a V. Esta afirmación se sigue 
del ejercicio 24. Ahora, como K(S) = V y T C V, entonces todos los elementos de T 
pertenecen a K (S), i.e., son combinaciones lineales de elementos de S. Así, los elementos 
de T que se añadieron a S, i.e., T \ S, ya eran combinaciones lineales de elementos de S 
y por lo tanto cada vez que un vector v de K(T') se expresa como combinación lineal de 
elementos de T, digamos 


(x) v = aw +: +akwk conaj E K, wj ET, 


si sucediera que alguno de los vectores w; de T está en TA S, escribiéndolo como combi- 
nación lineal de elementos de S: 


Wj= 0141 +F QU, con uw; E S 
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y substituyendo esta expresión para w; en (x*), tendremos que v es combinación lineal de 
elementos de S. En otras palabras, los elementos de T'| S no aportan nuevos vectores al 
considerar combinaciones lineales donde aparezcan porque los elementos de T \ S ya son 
combinaciones lineales de S. Para expresar esto diremos que los vectores de T' \ S son 
linealmente dependientes de S; en forma precisa: 


Definición 1.19. Sea T C V un subconjunto no vacío de un espacio vectorial V. Diremos 
que T es linealmente dependiente si existe algún vector v € T que es combinación lineal 
de los otros vectores de T, es decir, si v € K(TA {v}). 


Observaciones. (1). Note que no estamos pidiendo que todos los vectores u € T' sean 
elementos del correspondiente subespacio K(T \ {u}); lo que estamos pidiendo es que 
algún vector v € V satisfaga que v € K(T A {v}). 


(2). En la definición anterior, al decir que v sea combinación lineal de los otros vectores de 
T, la redacción se precisó diciendo que esto significa que v € K(T\{v}). Esta precisión es 
necesaria para tomar en cuenta el caso extremo cuando T = {0y } en el ejemplo siguiente: 


Ejemplo 26. Si V es un K-espacio vectorial y T C V es un subconjunto tal que Oy € T, 
entonces T es linealmente dependiente. En efecto, si T = {0y }, se tiene que 


0v € {0v} = K(0) = K(TA (0y)), 


donde se usó la convención de que K (Ø) = {0y }. 
Si T 4 [0y }, entonces existe un v Æ Oy en T y se tiene que 0y = 0-v es combinación 
lineal de v € T \ {0y}. 


Ejemplo 27. En R? el conjunto de vectores vı = (1,0), v2 = (0, 1), v3 = (3, 4) es lineal- 
mente dependiente ya que 


v3 = (3,4) = 3(1, 0) + 4(0, 1) = 3v1 + 4v2. 


Ejemplo 28. En R? el conjunto de vectores vı = (1,0), v2 = (0, 1), v3 = (3,0) es lineal- 
mente dependiente ya que 
v3 = (3,0) = 3(1,0) + 0(0, 1) = 3vı + 0v2. 


Note que aquí v2 = (0,1) no es combinación lineal de vı y v3 ya que cualquier 
combinación de éstos tiene la segunda coordenada igual a 0. 


La proposición siguiente nos da una caracterización muy útil de los conjuntos lineal- 
mente dependientes: 


Proposición 1.20. Sean V un K-espacio vectorial y T C V un subconjunto. Las afirma- 
ciones siguientes son equivalentes: 


(1) El conjunto T es linealmente dependiente. 


(2) El vector Oy se puede expresar como combinación lineal de algunos vectores v1, ..., Un 
enT: 


0y = 0101 +:** + Gn Un, 


con alguno de los escalares aj 40. 
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Nota: dado cualquier conjunto finito de vectores v1,... , Un, el vector Oy siempre es com- 
binación lineal de estos vectores ya que 
(1) Oy = 0v1 +-+: + Ovn, 


y decimos que la combinación lineal (f), donde todos los escalares son 0, es la combinación 
lineal obvia o trivial. Lo que la parte (2) de la proposición pide es que Oy se pueda expresar 
como una combinación lineal no trivial, es decir, que no todos los coeficientes sean el 
escalar 0. 


DEMOSTRACIÓN. (1) => (2): Si Oy € T, se tiene la combinación lineal no trivial 0y = 
1 - Oy con Oy € T. Si Oy Z V, como T es linealmente dependiente, existe un v Æ Oy en 
T que es combinación lineal de los otros elementos de T, i.e., v € K(T A {v}). Note que 
K(T \ {v}) 4 {0y} ya que v € TC K(T \ {v}). Así, existen vectores V],...,Um E€ T 
tal que 
V = 01U1 + *** + AmUm 
y por lo tanto 
0y = (—1)v + ajo ++: + amm 
es una combinación lineal con el coeficiente —1 de v € T distinto de 0. 
(1) = (2): Supongamos ahora que existen vectores v1, . . ., Un E T y escalares 41,..., an 
en K no todos cero, tal que 
(x) Oy = 4101 +: + anUn- 
Reordenando si hiciera falta, podemos suponer que aı # 0; multiplicando (*) por a EK 
se tiene que 
0y = a -0y = az (av +- + anun) 
= vı + (aĵ *a2)v2 ++ (az an) Wn 
de donde, despejando, 


v = (—a7"a2)v2 pect (—az *an)Un, 


es decir, vı es combinación lineal de v2, ... , Un ETA {v1}. 


Ejemplo 29. En R? los vectores e, = (1,0) y e2 = (0, 1) no son linealmente dependientes 
ya que si 0 = A¡e1 + Aze2, entonces 


(0,0) = A1(1,0) + A2(0,1) = (41,0) + (0, A2) = (A1, 42) 


y por lo tanto A1 = 0 y A2 = 0. Es decir, la única combinación lineal de e, y e2 que da el 
vector 0 es la combinación lineal trivial. 


Definición 1.21. Sea V un K-espacio vectorial. Si T C V es un subconjunto, diremos que 
T es linealmente independiente si T' no es linealmente dependiente. También diremos que 
los vectores de T son linealmente independientes. 


En vista de la proposición 1.18 la definición anterior es equivalente a: 


Corolario 1.22. Sea V un K'-espacio vectorial. SiT C V es un subconjunto, entonces 
T es linealmente independiente si y sólo si la única representación del vector Oy como 
combinación lineal de elementos de T es la trivial, i.e., si 


Oy = a101 +: + ann, conv; ET, 


entonces a =: -= An =Q. 
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El ejemplo 29 nos dice que e, y e2 son linealmente independientes en R°. 


Ejemplo 30. Sea V un K-espacio vectorial. Si v € V con v Æ Ov, entonces {v} es 
linealmente independiente ya que si Av = Oy es cualquier combinación lineal de v que da 
el vector Oy, y si sucediera que A Æ 0, entonces multiplicando por A7} € K se obtiene 
que 

AH(Av) = A*0y = Oy, 
i.e., v = A71 (Av) = Oy, en contradicción con ser v % 0y. 


Ejemplo 31. Al conjunto vacío f lo consideraremos linealmente independiente ya que para 
que un conjunto sea linealmente dependiente tiene que tener vectores. 


Ejemplo 32. En K[x] los vectores 1, x, 1?,...,x” son linealmente independientes, ya que 
si 
(x) ao: 1+ai-£+az2: £? +- +an r” = 0 


es cualquier combinación lineal de ellos que nos da el vector 0 € K[x], como el vector 0 
de K[x] es el polinomio cero y como en (*) a la izquierda se tiene el polinomio ay + a£ + 
a91?+---+a, 0”, éste es cero si y sólo si todos sus coeficientes son 0, i.e., aj = O para 
toda j y por lo tanto los vectores 1, £, 2?,...,x"” son linealmente independientes. 


Las propiedades siguientes son inmediatas: 


Proposición 1.23. Sea V un K-espacio vectorial. 


(1) Si T, € To C V son subconjuntos y T, es linealmente dependiente, entonces Ta 
también lo es. 


(Q) SiTi C Tə C V son subconjuntos y Ta es linealmente independiente, entonces T 
también lo es. 


DEMOSTRACIÓN. (1): Como T; es linealmente dependiente, el vector Oy se puede expre- 
sar como 
(x) Oy = 4101 +:-*+ anUn 


con algún a; 4 0 y los v; € Tı. Pero como Tı C T, entonces los v; € To y así (*) nos 
dice que T es linealmente dependiente. 
La parte (2) se sigue de (1). 


EJERCICIO 33. Muestre que los vectores de R? siguientes son linealmente independientes: 


© u= (1,0), v = (1,1) 
Gi) u = (2,1), v = (1,0) 
(iii) u= (1,2), v = (1,3) 
(iv) u = (3,1), v = (0,2) 


EJERCICIO 34. Muestre que los vectores de R? siguientes son linealmente independientes: 
1 


(Gi) u= (1,1,1), v = (0,1, —2). 

Gi) u = (-1,1,0), v = (0,1,2). 
(iii) u= (1,1,0), v = (1,1,1), w = (0, 1, —1) 
(iv) u = (0,1,0), v = (0,2,1), w = (1,5,3) 


EJERCICIO 35. Muestre que los vectores de R? siguientes son linealmente dependientes, 
expresando a v como combinación lineal de a y b: 
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G) v = (1,0); a = (1,1), b = (0,1). 
Gi) v = (2,1); a = (1,0), b = (1,1). 
(iii) v = (1,2); a = (2,1), b = (1, —1). 
(iv) v = (3,4); a = (0, 12), b = (6,0) 


EJERCICIO 36. Sea V = F(R,R) el R-espacio vectorial de funciones f : R —> R, 
to f(t). Muestre que los vectores siguientes son linealmente independientes: 
O v=1wv=t. 
GD v=tw=*t?. 
Gii) v = t, w = é. 
(iv) v = sent, w = cost. 
(v) v= sent, w =t. 
(vi) v = sent, w = sen (2t). 
(vii) v = cost, w = cos(3t). 
(viii) v = t?, w = e. 


EJERCICIO 37. Sea V como en el ejercicio anterior. Demuestre que las funciones 
vı = sent, va = sen(2t), vz = sen(3t), ..., Un = sen(nt) 


son linealmente independientes, para cualquier natural n € N. 


EJERCICIO 38. Sea V cualquier K-espacio vectorial. Si u,v € V con v Æ Oy y si u,v 
son linealmente dependientes, demuestre que existe un escalar A € K tal que u = Av. 


EJERCICIO 39. En el R-espacio vectorial P3(R), determine si el polinomio f(x) dado se 
puede expresar como combinación lineal de g(x) y h(x): 
G) fa) = x? — 3x + 5; gl£) = z? + 2x? — x + 1, h(x) = 34 +32? — 1. 
(ii) f(x) = 414422? — 6; g(x) = £? — 2x? + 4x + 1, h(x) = 3x? — 6x? +x + 4. 
üi) f(x) = 4224220413; g(x) = 2r? — 3x? +4r +1, h(x) = z? — x? +2243. 
(iv) f(x) = 1? — 8x? + 4x; glx) = z? — 2x? + 3x — 1, h(x) = 2? — 2z + 3. 


EJERCICIO 40. Sea V un K-espacio vectorial y sea T C V. Demuestre que T es lineal- 
mente independiente si y sólo si todo subconjunto de T es linealmente independiente. 


EJERCICIO 41. Sea V = C(R,R) el conjunto de funciones f : R — R tales que f 
es diferenciable (i.e., para todo x € R, existen todas las derivadas f'(x), f” (x), f” (x), 

FW (2),...). Muestre que V es un R-espacio vectorial. Si f(t) = e”? y g(t) = e*, 
con r Æ s en R, demuestre que { f, g} es linealmente independiente. 


EJERCICIO 42. Sea A = (aij]nxn una matriz cuadrada con entradas en un campo K y 
suponga que A es una matriz triangular superior. Demuestre que los vectores columna de 
A, vistos como vectores en K”, son linealmente independientes. 


EJERCICIO 43. Sea P,, (R) el R-espacio vectorial de polinomios de grado < n con coefi- 
cientes reales y sea f(x) € P,, (R) un polinomio de grado n. Demuestre que 


Ho), FE) Po), Pa) 
generan P,, (R). 
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EJERCICIO 44. Si V = Klzx], sea S =[f1,..., fn} E V un conjunto de polinomios no 
nulos tales que sus grados son distintos: gr(f,) 4 gr(f,) para toda i 4 j. Demuestre que 
S es linealmente independiente. 


1.6. Bases y dimensión 


Si V es un K-espacio vectorial, sabemos que siempre existe un subconjunto T C V 
que genera a V, a saber T = V, y sabiendo que T' genera a V quisiéramos encontrar un 
subconjunto B C T tal que B siga generando a V pero que B sea mínimo en el sentido de 
que si le quitamos cualquier vector v € B, el conjunto BA {v} ya no genera a V. Según lo 
que hemos estudiado en la sección anterior, si T es linealmente dependiente, le podemos 
quitar vectores y el conjunto que resulta sigue generando a V. El lema siguiente captura lo 
que está detrás de las observaciones anteriores: 


Lema 1.24. Sea V un K-espacio vectorial. Si B C V es un subconjunto mínimo de 
generadores de V, entonces B es linealmente independiente. 


DEMOSTRACIÓN. Si B fuera linealmente dependiente, existiría un vector v € B que es 
combinación lineal de los otros elementos de B, i.e., v € K(B \ [v)). Ahora, como 
BX {v} € K(B \ {v}) entonces B C K(BX {v}) y como K(B) = V, entonces 
K(B\ {v}) = V, es decir, B \ {v} genera a V, en contradicción con la minimalidad de 
B. 


Definición 1.25. Si V es un K-espacio vectorial, una base de V es un subconjunto B C V 
tal que: 

(y) B genera a V, 

(11) B es linealmente independiente. 


Así, el lema anterior nos dice que todo subconjunto mínimo de generadores de V es 
una base. El recíproco también es cierto: 


Proposición 1.26. Sean V un K-espacio vectorial y B C V un subconjunto. Entonces, B 
es un subconjunto mínimo de generadores de V si y sólo si B es base de V. 


DEMOSTRACIÓN. Para probar la implicación faltante, supongamos que B es una base de 
V pero que no es un subconjunto mínimo de generadores. Entonces, existe v € B tal que 
B \ {v} genera a V y por lo tanto v € K(B \ {v}) = V y consecuentemente B no sería 
linealmente independiente. Una contradicción. 


En términos de subconjuntos de vectores linealmente independientes de V, se tiene 
una caracterización de bases análoga a la de la proposición anterior, pero antes necesitare- 
mos un resultado preliminar: 


Lema 1.27. Sean V un K-espacio vectorial y T C V un subconjunto linealmente in- 
dependiente. Sea v € V \ T. Entonces, T U {v} es linealmente dependiente si y sólo si 
ve K(T). 


DEMOSTRACIÓN. Si TU{v} es linealmente dependiente, entonces existen vectores u1, ..., 
un en T U {v} tales que 
(1) aiui +-** + anun = Oy 


con algún coeficiente a; 4 0. Como T es linealmente independiente, no puede suceder 
que todos los vectores uj anteriores estén en T y por lo tanto alguno de ellos debe ser v. 
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Sin perder generalidad, supongamos que uy = v. Así, la igualdad (1) es: 
(2) a41U + 4389 +*+: + anUn = 0y, 


con algún aj 4 0. De nuevo, no puede suceder que a1 = 0 ya que (2) implicaría entonces 
que uz,...,Un es linealmente dependiente, en contradicción con el hecho de que T es 
linealmente independiente. Se sigue que aı 4 0 y así 


v= az (av) = az (—azu2 — -++ — An Un) 
= (—a *ay)us +-+- + (—a] 'an)un 


y por lo tanto v € K(T). 


Recíprocamente, si v € K (T), entonces existen vectores u1,..., Un E T y escalares 
Q1,...,@n E K tales que v = aiu + +++ + anun y así 
(3) 0y = a141 +++: + anun + (—1)v. 


Ahora, como v € VAT y los uj € T, entonces v % uj, para todos los j, y así en la 
igualdad (3) el coeficiente de v es —1 Æ 0, i.e., T U {v} es linealmente dependiente. 


Supongamos ahora que B es una base de un espacio vectorial V; entonces B es un 
subconjunto máximo de vectores linealmente independientes de V (en el sentido de que 
al agregarle cualquier otro vector de V a B, el conjunto resultante es linealmente depen- 
diente) ya que si v € VA B, como v € V = K(B). el conjunto B U {v} el conjunto es 
linealmente dependiente por el lema anterior. El recíproco también es cierto: 


Proposición 1.28. Sean V un K-espacio vectorial y B C V un subconjunto. Entonces, B 
es un subconjunto máximo linealmente independiente de V si y sólo si B es base de V. 


DEMOSTRACIÓN. Para probar la implicación faltante, supongamos que B es máximo li- 
nealmente independiente. Como B es linealmente independiente, para probar que B es 
base sólo falta probar que B genera a V. Supongamos que esto es falso, es decir, que exis- 
te un vector v € V tal que v 4 K(B). Entonces, el lema anterior implica que B U {v} es 
linealmente independiente, en contradicción con la maximalidad de B. 


Espacios vectoriales de dimensión finita. A pesar de que existen espacios vectoriales con 
bases infinitas, en este libro trataremos con más detalle el caso de espacios vectoriales con 
bases finitas y el teorema siguiente nos dice cuándo existe una tal base finita para ciertos 
espacios vectoriales. 


Teorema 1.29. Si V es un K-espacio vectorial generado por un conjunto finito de vectores 
T C V, entonces algún subconjunto de T es una base de V y, por lo tanto, V tiene una 
base finita. 


DEMOSTRACIÓN. Si T = ó T = {0y }, entonces V = {0y } y el subconjunto Y) C T es 
una base finita de V. Supongamos ahora que T contiene un vector distinto de Oy, digamos 
u1 # Oy. Entonces, (u1 } es linealmente independiente. Si Lu; + es base de V ya acabamos. 
Si (uy) no es base de V, entonces existe un uz € T \ {u1 | tal que uz no es combinación 
lineal de u; y así {u1, u2} es linealmente independiente. Si es base de V, ya acabamos. 
Si no lo es, procediendo inductivamente supongamos que B = {u1,..., Un} C T es 
linealmente independiente y que es máximo con esta propiedad, es decir, para cualquier 
v € TAB se tiene que BU {v} es linealmente dependiente. Mostraremos que B es base de 
V y para esto basta probar que B genera a V. Ahora, como T genera a V, basta entonces 
mostrar que T C K(B). Para esto, sea v € T. Si v € B, entonces v € K(B). Siv ¢ B, 
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entonces por la hipótesis de maximalidad sobre B se tiene que B U {v} es linealmente 
dependiente y por el lema anterior esto implica que v € K(B) como se quería. 


El teorema siguiente captura la propiedad más importante de los espacios vectoriales 
que tienen una base finita: 


Teorema 1.30. Sea V un K-espacio vectorial y supongamos que B = [v1,...,un y es un 
subconjunto finito de V. Entonces, B es una base de V si y sólo si cada vector v € V se 
puede expresar en forma única como combinación lineal de los vectores de B, i.e., existen 
escalares únicos Az,..., An en K tales que 


(x) v = A101 +:::+AnUn- 


DEMOSTRACIÓN. Si B es base de V y v € V, como B genera a V, entonces v es combi- 
nación lineal de los elementos de B, digamos 


(1) v = A101 Hee H Anth. 
Supongamos que 
(2) V = Y101 F F YnUn 
es otra expresión de v en términos de $, con los y; € K. Restando (1) y (2) se obtiene: 
(1) Oy =(A1 — 1391 +++: F (An — Ym)Un 


y como los vectores v1, . . . , Un son linealmente independientes, la igualdad (ft) implica que 
Aj — Y; = 0 para toda j , y por lo tanto Aj = yj, para toda j; es decir, la expresión (*) para 
v es única. 

Recíprocamente, si cada v € V se puede expresar en forma única de la forma (x), 
entonces B genera a V y sólo falta probar que B es linealmente independiente. Pero esto 
es directo ya que si 


(3) Oy = A1U1 +++ + AnUn 
con los A¿ € K, como 


(4) 0y = 0v1 EA Ovn, 


la unicidad de la expresión de Oy como combinación lineal de los v;, implica que los 
escalares en (3) y (4) son iguales, i.e., Aj = O para toda j, y por lo tanto v1, ...,Un son 
linealmente independientes. 


El teorema 1.29 nos dice que todo espacio vectorial con un conjunto finito de genera- 
dores (a veces decimos, finitamente generado para indicar lo anterior), tiene una base finita. 
A continuación probaremos uno de los resultados más importantes de la teoría que estamos 
desarrollando: todas las bases de un espacio vectorial finitamente generado tienen el mis- 
mo número de elementos. La demostración esencialmente considera dos bases del espacio 
dado y reemplaza los vectores de una base con los de la otra. Para ver cómo se hace esto 
necesitaremos el lema siguiente, cuyo nombre proviene del método en su demostración: 


Lema 1.31 (Lema de reemplazamiento). Sea V un K-espacio vectorial generado por un 
conjunto finito de vectores v1, ..., Un. Supongamos que w1, ..., Wm son m vectores de V 
con m > n. Entonces, los vectores w, ..., Wm son linealmente dependientes. Equivalen- 
temente, si W1, ..., Wm son linealmente independientes, entonces m < n. 
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DEMOSTRACIÓN. Supongamos que w1,...,W, son linealmente independientes. Como 
U1,+..,U, generan V, para el vector wı € V existen escalares a;,...,a, en K tales que 
(1) wi = 04101 +:** + anUn. 


Ahora, como estamos asumiendo que los w; son linealmente independientes, entonces 
w1 Æ 0y y así en (1) algún a, 4 0. Renumerando si hiciera falta podemos suponer que 
al 40 y así podemos despejar vı de (1) para obtener: 


=i zA e 
UV = 44 Wi — 01 Q2V2 —*** — Qi AnUn, 
por lo que vı € K(w;,,v2,...,Un) y así 
V =K(v1,02,-..,0n) € K(w1,02,-..,Un) E V 


y consecuentemente V = K(w1,v2,...,Un), es decir, ya reemplazamos a vı por wı en 
un conjunto de generadores de V. La idea es continuar inductivamente el proceso an- 
terior hasta reemplazar todos los vectores v1, V2,...,Un por vectores w1,...,w, de tal 
forma que {w1,..., Wn} todavía genere a V. La base de la inducción es la substitución 
de vı por w; que hicimos antes. Supongamos ahora que ya reemplazamos k vectores de 
[v1,...,Un y por k vectores de {w1,..., Wn} con 1 < k < n. Renumerando si hicie- 
ra falta podemos pensar que reemplazamos v1, ...,Uk por w1,...,wz de tal forma que 
[01,..., Wk,Uk+1)- + +, Un } genera V. Entonces, para el vector wx+1 € V existen escala- 
res b1,...,Dx,Cx+1,... Cn en K tales que 


(2) wWr+1 = d1W01 +- + OkWk + Cr+10+1 +: + Cnn. 


Observe ahora que en (2) no se puede tener que todos los c; = 0, ya que si esto sucediera 
(2) diría que w1,..., Wk, Wk+1 son linealmente dependientes (el coeficiente de wz, es 
1 Æ 0), en contradicción con la suposición inicial de que los w; son linealmente indepen- 
dientes. Se sigue que algún c; 4 0. Renumerando si hiciera falta podemos suponer que 
Cr+1 # 0 y así se puede despejar a vz+1 de (2) para obtener vk+ı como combinación 


lineal de w1, ..., Wk, Wk+1) Uk +25 - + + ) Un» 1.€., 
Var E K(w1,..., Us 

y como, por hipótesis de inducción K(w1,...,Wk,Uk+1,Uk+2)-»+,Un) = V, se sigue 
que 0],..., Wk+1,Uk+2)--- , Uy genera V. Así, ya reemplazamos a Uz +1 por wx+1. Por 
inducción se sigue que podemos reemplazar a todos los v1, ..., Un por w1, ...,Wn de tal 
forma que w1, ..., Wn todavía genere a V. 

Finalmente, si sucediera que m > n, entonces Wm € K(w;,...,w,) se puede escribir 
como 


WwW = 011 +:** + QgWn 


con los œj € K, y por lo tanto (Ww1,...,Wn, +. - , Wm } sería linealmente dependiente. 


La consecuencia más importante de este lema y de su demostración es: 


Teorema 1.32. Sea V un K-espacio vectorial finitamente generado y supongamos que 
A= {v1,..., Uun} y B = [w1,..., Wm} son bases de V. Entonces, m = n. 


DEMOSTRACIÓN. Como A genera V y como B es linealmente independiente, el lema 
anterior nos dice que m < n. Cambiando los papeles de A y B se sigue que n < m y por 
lo tanto m = n. 


Gracias a este teorema tiene sentido la definición siguiente: 
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Definición 1.33. Sea V un K-espacio vectorial y supongamos que B = {v1,..., Un} es 
una base de V. Por el teorema anterior el número n está unívocamente determinado por 
V. Al número n de vectores en cualquier base de V se le llama la dimensión del espacio 
vectorial V y se denota n = dimx(V). Algunas veces decimos que V es un K-espacio 
vectorial de dimensión finita n. 


Ejemplo 33. Si V = K”, entonces dimg(K”) = n. En efecto, sólo tenemos que mostrar 
una base de K” con n vectores. Para esto, pongamos 


er =(1,0,...,0); e2 =(0,1,0,...,0); ...; en =(0,...,0,1) 


en K”. Entonces, 


(1) Los vectores e,,..., e, generan K” ya que si v = (a;,...,a,) es cualquier vector de 
K”, se tiene que 
v=(a1,...,4n) = (aj,0,...,0)+---+(0,...,0,1) 


= a(1,0,...,0) +--+ +an(0,...,0,1) 


= 01€1 +: + anen. 


(11) Los vectores e1, .. . , €n son linealmente independientes ya que si a1, . . . , Œn SON esca- 
lares tales que 


0 = (0,...,0) = ager +:::+0Qntn 
E (a1, 0,...,0) +- + (0,...,0, an) 
= (91,...,Q), 
entonces 0; = 0, œz = 0, ..., An = 0, por definición de igualdad de vectores en K”. 
A la base ([e1,..., €n } de K” algunas veces se le llama la base canónica de K”. 


Corolario 1.34. Sea V un K-espacio vectorial de dimensión finita n. Entonces, cualquier 
conjunto de vectores linealmente independientes de V tiene cardinal < n. 


DEMOSTRACIÓN. Sea B = {v1,..., Un} una base de V. Si w1,..., Wm son vectores 
linealmente independientes, por el lema de reemplazamiento se tiene que m < n. 


Corolario 1.35. Sea V un K-espacio vectorial de dimensión finita n. Entonces, cualquier 
conjunto de generadores de V tiene cardinal > n. 


DEMOSTRACIÓN. Sea B = {v1,..., Un} una base de V. Si wı,..., Wm generan V, por 
el lema de reemplazamiento cambiando los papeles de los v; y los wj, como los v; son 
linealmente independientes, se debe tener que n < m. 


Corolario 1.36. Sea V un K-espacio vectorial de dimensión finita n. Entonces, cualquier 
conjunto de n vectores linealmente independientes de V es una base de V. 


DEMOSTRACIÓN. Sea B = {v1,..., Un} una base de V. Si wı,..., Wn son n vectores 
linealmente independientes, por el lema de reemplazamiento podemos substituir los vecto- 
res v; por los vectores w; de tal forma que los w; generan V. Como los w; son linealmente 
independientes y ya vimos que generan V, entonces son una base de V. 


Corolario 1.37. Sea V un K-espacio vectorial de dimensión finita n. Entonces, cualquier 
conjunto de n generadores de V es una base de V. 
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DEMOSTRACIÓN. Si 1,...,w, son n generadores de V, queremos probar que son li- 
nealmente independientes. Si no lo fuera así, algún vector w; dependería linealmente de 
los otros; renumerando si hiciera falta podemos suponer que wn € K(w1,...,Wn-1) y 
por lo tanto ww1,...,w,-1 generan V, en contradicción con el corolario 1.35. 


Corolario 1.38. Sea V un K-espacio vectorial de dimensión finita n. Entonces, cualquier 
conjunto de vectores linealmente independientes de V se puede extender a una base de V. 


DEMOSTRACIÓN. Sean v1,...,uz vectores linealmente independientes de V. Por el pri- 
mer corolario, k < n. Si sucediera que k < n, por el segundo corolario los vectores 
V1, ..., Uk no generan a V. Así, existe un Vx+1 E V tal que vk}ı Z K(v1,..., vp). Por 
el lema 1.27 esto es equivalente a que {v1, . . . , Uk, Vk+1 } es linealmente independiente. Si 
k +1 < n, repetimos el argumento; por inducción obtenemos de esta manera n vectores 
linealmente independientes U¡,...,Uk,Ux+1,---, Un en V, y por el tercer corolario ésta 
debe ser una base de V. 


La dimensión de subespacios. Que la dimensión es una medida de los espacios vectoria- 
les, lo confirma el corolario siguiente: 


Corolario 1.39. Sea W un subespacio de un K-espacio vectorial V de dimensión finita. 
Entonces, W tiene dimensión finita y además 


Más aún, si W C V y dimx(W) = dimx(V), entonces W = V. 


DEMOSTRACIÓN. Pongamos n = dimg (V). Si W = {0y }, entonces W tiene dimensión 
finita dimg (W) = 0 < n = dimg (V). Si W 4 {0y }, entonces existe un wı # Oy en 
W y {w;} es linealmente independiente. Continuando de esta manera, encontramos vec- 
tores linealmente independientes w1, ..., wz en W. Ahora, como W C V, estos vectores 
linealmente independientes están en V, y como dimg(V) = n, entonces k < n por el 
primer corolario. Por lo tanto, el proceso anterior de construir vectores linealmente inde- 
pendientes w1, ..., wg en W debe parar en un punto k < n cuando al añadir cualquier 
otro vector w de W al conjunto {w1,..., wg}, el conjunto resultante (w,,...,wx,w) 
es linealmente dependiente. Por el lema 1.27 se sigue que {w1,..., wg} genera a W y 
así dimk(W) = k < n = dimx(V). 

Finalmente, si dimg (W) = dimx(V), entonces una base de W es una base de V y 
así W = V. 


Bases de sumas directas. Dado un K-espacio vectorial de dimensión finita V y un su- 
bespacio vectorial U C V, mostraremos a continuación que V se descompone como 
V = U ® W, para algún subespacio W de V y luego calcularemos la dimensión de V 
en términos de las dimensiones de U y W. 


Proposición 1.40. Sea V un K-espacio vectorial de dimensión finita n y sea U un subes- 
pacio vectorial de V. Entonces, existe un subespacio vectorial W de V tal que V = UW. 


DEMOSTRACIÓN. Escojamos una base {v1, . . . , vz) de U. Por 1.38 este conjunto se puede 
extender a una base de V, digamos {v1,. . . , Uk, Uk+1, +++, Un y. Sea W = K (Uk+1, . -< , Un). 
Entonces, W es un subespacio de V y se tiene que: 

V =U +W ya que si v € V, como v,...,Un es base de V, entonces 


V = 0101 F: F AakUk + ak+1Vk+1l +*** + Aann 


= (0101 +: + akUk) + (ak+1Uk+1 H't: + anun), 
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con aV H't + 4x0 E U y ak41Uk41 ++: + QnUn E W. 
Gi) U N W = {0y } ya que si v € U N W, entonces 
vEU => v= Mu t: + AÀkUk 
veW > V = Akp1Ukp1 +++ AnUn 


y restando, 

Oy = A101 +++ + AgU% — Akpet + 00 ÁnUn 
y como {v1,.. . , Un } es base de V, la igualdad anterior implica que todos los A; = 0 y por 
lo tanto v = 0y. 


Proposición 1.41. Sea V un K-espacio vectorial de dimensión finita y supongamos que 
V = U 68 W, con U, W subespacios vectoriales de V. Entonces, 


DEMOSTRACIÓN. Sean A = {u1,..., ug} una base de V y B = {w1,..., wr} una base 
de W. Entonces, A U B es una base de V ya que: 


(1). AU B genera V, porque si v € V, como V = U ẹ W, entonces existen u € U y 
w € W tales que v = u+w. Ahora, como A es base de U, entonces u = a1u1 +: :+aguk. 
Similarmente, como B es base de W, entonces w = biw +--- +b,w,. Se sigue que 


v =u +W = au +: + QU + biwi +: +0,W.. 
(2). A U B es linealmente independiente, porque si 
Oy = a1U1 +--*+0gU + biwi +: + brwr, 
entonces 
Oy = 0y + Oy 
= (a1U1 +: + apuk) + (biwi +: + brwr), 


y por la unicidad de la expresión de Oy, se tiene que 


Oy = a1u1 +-:-- + aguz en U 

Oy = biwi +-:--+0b,w,, en W 
y como A es base de U, la primera igualdad implica que a; = +++ = az = 0 y, análoga- 
mente, la segunda igualdad implica que bı = +++ = b, = 0. 


EJERCICIO 45. Sea V = R?. 
(1) Muestre que los vectores vı = (2, —3, 5), va = (8, —12, 20), v3 = (1,0, —2), 
va = (0,2, —1) generan R. 
(11) Aplique el método dado en la demostración del teorema 1.28 para escoger una 
base de R? entre los vectores de (i). 


EJERCICIO 46. Sea V C R? el conjunto de vectores v = (x,y, z) que satisfacen la ecua- 
ción lineal x + y + z = 0. 

(i) Muestre que V es un subespacio vectorial de R3. 

(11) Encuentre una base de V y calcule su dimensión. 
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EJERCICIO 47. ¿Cuál es la dimensión del espacio vectorial Mat2.2(K)? Dé una base. 
EJERCICIO 48. Calcule la dimensión de Mat» xn (K). Dé una base. 


EJERCICIO 49. Sea W = {A € Matnxn(K);: A es diagonal]. Calcule la dimensión de 
W. 


EJERCICIO 50. Sea W el subespacio vectorial de matrices n x n triangulares superiores 
con entradas en un campo K. Calcule su dimensión. 


EJERCICIO 51. Sea W = {A € Matəx2(K) : A es simétrica). Calcule la dimensión de 
W. 


EJERCICIO 52. Sea W = {A € Matnxn( K) : A es simétrica). Calcule la dimensión de 
W. 


EJERCICIO 53. Sean V = Mat3x3(K)y W = {A € V : Tr(A) = 0}. Calcule la 
dimensión de W. 


EJERCICIO 54. Sea W C R° un subespacio vectorial. ¿Cuáles son las dimensiones posi- 
bles de W? Demuestre que las posibilidades para W son: W = {0}, W = R3,W = £ 
(una recta por el origen), W = P (un plano por el origen). 


EJERCICIO 55. Sea P„( K) el espacio vectorial de polinomios de grado < n con coeficien- 
tes en un campo K. Calcule la dimensión de P„ (K) y dé una base. 


EJERCICIO 56. Sea V = P, (R) y fije un real a € R. 


G) Demuestre que el conjunto W = {f € P,(R) : f(a) = 0} es un subespacio 
vectorial de V. 
(11) Calcule su dimensión. 


EJERCICIO 57. Considere a C” como un R-espacio vectorial. Calcule dimp(C”). Expli- 
que. 


Capítulo 2 


Transformaciones lineales 


ABIENDO COMENZADO EL ESTUDIO de los espacios vectoriales, es natural pensar en 
H compararlos. Para esto, como los espacios vectoriales son conjuntos, sabemos que 
las funciones entre conjuntos son relaciones entre ellos y de alguna manera los comparan. 
Ahora, los espacios vectoriales son conjuntos con una estructura adicional, a saber, sus 
elementos se pueden sumar y se pueden multiplicar por escalares del campo dado. Así, las 
funciones entre espacios vectoriales que nos interesan son aquellas que preservan la estruc- 
tura de espacio vectorial de los espacios involucrados; es decir, consideraremos funciones 
entre espacios vectoriales que respetan la suma de vectores y el producto de un escalar por 
un vector. Estas funciones se dice que son lineales y en este capítulo comenzamos su estu- 
dio, mostrando sus propiedades principales para culminar con la conexión entre funciones 
lineales entre espacios vectoriales de dimensión finita y matrices con entradas en el campo 
dado. 


2.1. Transformaciones lineales 


En esta sección comenzamos el estudio de las funciones! lineales entre espacios vecto- 
riales y de algunos subespacios vectoriales asociados a ellas. Varios ejemplos ilustrarán los 
conceptos y propiedades que veremos, en particular consideraremos ejemplos importan- 
tes que provienen de la Geometría de R?, a saber, rotaciones, reflexiones y proyecciones. 
También veremos algunos ejemplos que nos provee el Cálculo: la derivación e integración 
son funciones lineales. 


Definición 2.1. Si V y W son dos K-espacios vectoriales, una transformación lineal entre 
V y W es una función T : V — W que satisface: 

© T(u+v)= T(u) + T(v), para cualesquiera u,v € V. 

GD T(Aw) =AT (o), prave Vy Ae K. 


NOTA. Si T : V — W es una transformación lineal, algunas veces diremos que T : V —= 
W es K-lineal, para enfatizar el papel del campo K en la definición. También diremos que 
T es una aplicación lineal o una función lineal. 


Ejemplo 1. La función f : R — R dada por f(x) := qx, para o; € R un real fijo, es una 
transformación lineal. 


Ejemplo 2. La función T : R? — R? dada por T(x, y) := (21+y, 2—3y) es una aplicación 
lineal, ya que: 


lUsaremos como sinónimos de función a las palabras aplicación y transformación. 
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(i) Si u = (x,y) y v = (x', y”) son dos vectores de R?, entonces u + v = (1 + 
xy + y!) y así 
Tlu+ vo) =Tle+a,y+y)= (Ur +x) + (y +y’), (1 +z) —3(y + y) 
= ((22 + y) + Qu! + y), (x — 3y) + (1 — 3y”)) 
= (22 +y,0—3y) + (Qu + y', x — 3y') 
=T(2,y) +T(2, y”) 
= Tu) + T(v). 
Gi) Si A ER, entonces Au = (Az, Ay) y así 
TQu) = T(x, Ay) = Q(Az) + Ay, Ax — 3(Ay)) 
= A(2x + y, x — 3y) 
= AT (x,y) 
= AT (u). 


Ejemplo 3. La función L : R? — R? dada por T(x, y,z) := (£ + z,y — z) es una 
transformación lineal, ya que: 
(i) Si u = (x,y,z) y v = (x',y', 2”) son dos vectores de R3, entonces u + v = 
(142, y+y,2+2) y así 
Tlu+v)=T(24+ 0 y+y)2+2)= (1412) + (242), (y +9) — (2 +2") 
= ((1+ 2) + (2 +2), (y — 2) + (y — 21) 
= (æ+ zy- z) + (0 +2 Y 2) 
= T(x,y, z) +T(£',y', z 
= T (u) + T (v). 
Gi) Si À ER, entonces Au = (Ax, Ay, Az) y así 
TQ) = T(Ax, Ay, Az) = (Ax + àz, Ay — Az) 
= A(x + z,y— 2) 
= AT (x,y,z) 
= ÀT (u). 


Ejemplo 4. Si V = Rlx] es el R-espacio vectorial de polinomios con coeficientes en R, 
recordemos del Cálculo que la derivada de un polinomio p(x) € R[x] es otro polinomio 
p'(x) € R[x]; así, si definimos la función 

D : R[x] — Rl[x] mediante D(p(x)) := p' (x), 
se tiene que D es una transformación lineal ya que la derivada de una suma de funciones 
es la suma de las derivadas y la derivada saca constantes. 


Ejemplo 5. Sea V = C([0, 1], R) el R-espacio vectorial de funciones continuas del intervalo 
[0, a a R. A cada función continua f € C([0, 1], R) le podemos asociar su integral definida 
SF x)dx € R y así tenemos una función 


T:C([0,1),R) — IR dada por I(f J= [sas 
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la cual es lineal ya que la integral de una suma de funciones continuas es la suma de las 
integrales y la integral saca constantes. 


Ejemplo 6. Rotaciones en R?. Si fijamos un ángulo 0 € R, dado un vector arbitrario 
v = (a,b) € R?, queremos obtener el vector Rg(v) que se obtiene rotando el vector v 
alrededor del origen O de R? el ángulo 0: 


al 


Para facilitar la geometría involucrada, pensemos que 0 es un ángulo positivo (medido 
en sentido contrario al de las manecillas de un reloj) y consideremos el caso cuando el 
vector v = (a, b) está en el primer cuadrante de R?, como en la figura anterior. 

El vector v = (a, b) determina el triángulo rectángulo de catetos a, b, y denotamos su 
hipotenusa por h. Observe ahora que si ¢ġ es el ángulo que hace el vector v con respecto al 
semieje horizontal positivo: 


a] 
b 
e E 


a 


al 


entonces 

cosp=a/h y send =b/h, 
por lo que 

v = (a,b) = (h cos ġ, h sen ġ). 

Consideremos ahora al vector Rọ(v) = (x,y) y pensemos ahora en las dos figuras 
anteriores. La primera observación es que en el triángulo rectángulo que forma el vector 
Ro(v), los catetos son x e y, y la hipotenusa es la misma h que la del vector v. Por eso 
decimos que las rotaciones son transformaciones rígidas, 1.e., en particular no cambian las 


longitudes. Luego observamos que el ángulo que forma Rọ(v) con el semieje positivo X 
es 0 + ¢. Entonces, si Rọ(v) = (x, y), sus componentes x, y satisfacen que 


x = hcos(0 + q) 
y = hsen(0 + p). 
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Recordemos ahora que 
cos(0 + ġ) = cos 0 cos d — sen 0 sen $ 
sen(9 + $) = sen O cos d + sen cos 0. 


Entonces, 
x = hcos(0 + p) = hcos 0 cos $ — h sen 8 sen $ 
y = hsen(0 + ġ) = hsen 9 cos d + h sen ġ cos 0, 


y como a = hcos q y b = hsen q, substituyendo arriba obtenemos 
x = acos — bsen 0 
y = asen 0 + bcos0, 
es decir, si v = (a,b) € R?, entonces 
Ro(v) = (acos 0 — bsen 8, a sen O + b cos 0) 
define la función rotación Ry : R? — Rĉ?. Mostraremos que Rọ es lineal: 
(i) Si u(a,b) y v = (a!, b”) son dos vectores de R?, entonces 
Rolu +v) = Rola +a',b +b") 
= ((a + a') cos 0 — (b + b') sen 0, (a + a’) sen 0 + (b +0") cos 0) 
= (acos 0 — bsen 0, a sen 0 + bcos 0) 
+ (a! cos 0 — b' sen 0, a’ sen O + b' cos 0) 
= Rolu) + Rolu). 
(ii) Si u(a,b) € R? y A € R, entonces 
RelAu) = Re(Aa, Ab) 
= ((Aa) cos 0 — (Ab) sen 0, (Aa) sen 0 + (Ab) cos 0) 
= A(acos0 — bsen 6, a sen 0 + bcos 0) 
= ARo(u). 


Ejemplo 7. Reflexiones en R?. Si v = (a,b) € R?, el vector (a, —b) se obtiene a partir de 
v reflejándolo con respecto al eje X: 


=X 


(a, —b) 


y se tiene así una función T : R? — R? dada por T (a,b) = (a, —b), a la cual se le llama 
la reflexión con respecto al eje X. Similarmente se tiene la reflexión con respecto al eje Y. 
Cada una de estas reflexiones es una transformación lineal, como el lector puede verificar 
fácilmente. 
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Ejemplo 8. Proyecciones de R°. Si v = (x,y) € R?, la función pry : R? — R dada por 
prx(x, y) = z, se llama la proyección sobre el eje X: 


ol 
8 


Similarmente, la función pry : R? — R dada por pr y (1, y) = y, se llama la proyec- 
ción sobre el eje Y. Las dos proyecciones anteriores son transformaciones lineales como 
se puede verificar fácilmente. 


Ejemplo 9. Proyecciones de R?. En forma análoga al ejemplo anterior, se tienen las pro- 
yecciones 
Pry, Pry, prz : R3 —> R 
dadas por 
Pry (2, Y, z) =T, pry (z, yY, z) =y, prz(z, Y) z) = 2. 
Además también se tienen las funciones que proyectan un vector sobre uno de los 
planos coordenados, por ejemplo, la proyección sobre el plano XY: 


Plxy : R? — R? dada por prxy(x, y, 2) = (x,y) 


proyecta el vector v = (x,y,z) sobre su sombra en el plano XY al cual indentificamos 
con el espacio vectorial R?: 


X 


Similarmente se tienen las otras dos proyecciones sobre los planos coordenados X Z 
yYZ: 
Pryz : R? > R? dada por pr y z(x,y, z) = (zx, z) 


y 
Pry z : R? => R? dada por Pryz(z, y, z) T (y, z). 


Se demuestra fácilmente que todas estas proyecciones son funciones lineales. 


Ejemplo 10. La función traza, Tr : Matnxn( K) — K dada por 


Tr(as;) = > Aii, 
i=1 
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es una transformación lineal. 


Ejemplo 11. La función transposición, t : Matmxn( K) —> Matnxm( K) dada por t( A) = 
t A, también es una transformación lineal. 


Ya para finalizar nuestra lista de ejemplos, se tienen dos transformaciones lineales que 
están presentes siempre: 


Ejemplo 12. Si V es cualquier K-espacio vectorial, la función identidad idy : V — V 
dada por idy (v) = v, es lineal. 


Ejemplo 13. Si V y W son dos K-espacios vectoriales cualesquiera, la función cero 0 : 
V — W dada por 0(v) = Ow, es decir, manda todos los vectores de V al vector Ow de 
W, también es lineal. 


Hemos definido las transformaciones lineales como funciones T : V — W entre 
espacios vectoriales que preservan sus operaciones. Las propiedades siguientes deben ser 
entonces naturales: 

Proposición 2.2. Sea T : V — W una transformación K -lineal. Entonces 
(1) T(0y) = 0w, donde Oy y Ow son los neutros aditivos de V y W respectiva- 
mente. 
(D T(—v) = —T(v), para todo v € V. 
(3) T(au + bv) =aT (u) +dT (v), para u,v € V ya,b E K. 
DEMOSTRACIÓN. (1): T(0y) = T(0y + 0y) = T(0y) + T(0y), ya que Oy es neutro y 
T es lineal. La igualdad anterior y la ley de cancelación implican que T(0y) = Oy. 
Q): Tw) + T(—v) = T(v — v) = T(0y) = Ow, la última igualdad por la parte (1). La 
igualdad T(v) + T(—v) = Ow y la unicidad del inverso aditivo implican que T(—v) = 
—T (vu). 
(3): Sia,b € K y u,v € V, entonces 
T(au + bv) = T (au) + T(bv) porque T es lineal 
=aT(u)+bT(v) porque T es lineal. 


Proposición 2.3. Si L : U — V yT : V — W son transformaciones K-lineales, entonces 
la composición T o L : U — W también es lineal. 


DEMOSTRACIÓN. (1): Sean u, v € V. Entonces, 
(To L)\(u+v)=T(L(u+v)) por definición de composición 
=T(L(u) + L(v)) porque L es lineal 
=T(L(u)) + T(L(v)) porque T es lineal 
= (T o L)(u)+ (T o L)(v) por definición de composición. 
(2): Sean u € V y A € K. Entonces, 
(To AAN T(L(Au)) por definición de composición 
) porque L es lineal 
) porque T es lineal 
( 


= 2 o L)(u) por definición de composición. 
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Proposición 2.4. SiT : V — W es una transformación lineal biyectiva, entonces la 
función inversa T7} : W — V también es lineal. 


DEMOSTRACIÓN. (1): Sean u,v € W y sean u’, v’ € V tales que T(u”) = uy T(v”) = v. 
Entonces, u+v=T(u”) + T(v') = T(u' + v’), ya que T es lineal. Se sigue que 


T (u +v) =u +v =T! (4) +T (w). 


(2): Sean u € V y A € K. Sea u’ € V tal que T(u”) = u. Entonces, Au = AT (u') = 
T(Au'), ya que T es lineal. Se sigue que 


T7(Au) = Au’ = AT! (u). 


Definición 2.5. Si T : V — W es una transformación lineal biyectiva, diremos que T es 
un isomorfismo de espacios vectoriales. 


Así, la proposición anterior nos dice que la función inversa de un isomorfismo T : 
V — W es un isomorfismo también. 


Ejemplo 14. Si V es cualquier K-espacio vectorial, la función identidad es un isomorfismo. 
En efecto, por el ejemplo 12, la identidad es lineal y es claro que es biyectiva. 


Ejemplo 15. Sea T : Mat2x2(RR) — R* la función dada por 
a b 
ce 4) 0600. 


Entonces, T es un isomorfismo. Es claro que T es lineal. Para mostrar que T es inyectiva, 


supongamos que 
a b a Y 
AE 


Entonces, (a, b,c, d) = (a!,b', c!, d”) y por lo tanto a = a’, b = b', c = c', d = d'. Se sigue 


que 
a b\ (d V 
ed) A a d)’ 
Para mostrar que T es suprayectiva, sea w = (a,b,c,d) € R£. Entonces la matriz 


A= i 4) este TA) = w 


Ejemplo 16. La función L : P¿(R) — R? dada por L(ay + a11 + azz?) = (ao, a1, a2) es 
un isomorfismo. Es claro que es lineal. Para ver que es inyectiva, supongamos que 


2 / / 2 
L(ao + aiz + az2%) = La, + a 1 + agx"). 
PS AN l e E : : 
Entonces, (ao, 41,42) = (ap, a1, as) y así a; = a, por lo que los polinomios correspon- 


dientes son iguales. Que L es suprayectiva es porque si w = (a,b,c) € R, el polinomio 
f(x) =a+bx+ ca? € Pa(R) es tal que L(f(x)) = w. 


La palabra isomorfismo, de las raíces griegas iso que significa igual y morfé que sig- 
nifica forma, captura la propiedad de que una transformación lineal biyectiva entre dos 
espacios vectoriales identifica a estos dos espacios, tanto como conjuntos (la biyectividad 
de la función) como con respecto a sus estructuras, identificando la suma de un espacio con 
la suma en el otro, e identificando el producto de un escalar en un espacio con el producto 
por un escalar en el otro. De alguna manera nos dice que los dos espacios son el mismo, 
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sólo presentados de diferente manera o nombre. En particular, en el caso de espacios vecto- 
riales de dimensión finita, esperamos que los isomorfismos se comporten bien con respecto 
a las bases y a la dimensión de los espacios. 


Proposición 2.6. Sea T : V — W una transformación lineal inyectiva. Si v],...,Un son 
vectores de V linealmente independientes, entonces T(v;),..., T (un) son vectores de W 
linealmente independientes también. 
DEMOSTRACIÓN. Supongamos que se tiene una combinación lineal 

aT(v1) +--+ anT(vn) = 0w. 


Entonces, como T es lineal, T (a1v1 +- -+ + anvn) = Ow. Ahora, como T (0y) = Ow por 
2.2(1), entonces T (0y) = T (avı +: :+anVn), y como T es inyectiva, esto último implica 


que a101 +-** + Ay Un = Oy. Pero como v1,...,Un son linealmente independientes, 
entonces la combinación lineal anterior implica que a; = 0 para todo 2, y por lo tanto 
T(v1),...,T(v,) son linealmente independientes. 


Una consecuencia inmendiata es que los isomorfismos entre espacios vectoriales de 
dimensión finita preservan la dimensión: 


Teorema 2.7. Sea T : V — W un isomorfismo entre espacios vectoriales de dimensión 
finita. Entonces, dim V = dim W. 


DEMOSTRACIÓN. Sean m = dim V y n = dim W. Si {v1,..., Um} es una base de V, 
como T es inyectiva la proposición anterior nos dice que T (v1), ..., T (Um) son vectores 
de W linealmente independientes y por lo tanto m < n por 1.35. 

Ahora, como Tt : W — V también es un isomorfismo, si [11,...,w, } es una base 
de W, como T~! es inyectiva la proposición anterior nos dice que T~! (w1), ..., T7*(w,,) 
son vectores de V linealmente independientes y por lo tanto n < m por 1.35. 

Se sigue que m = n. 


EJERCICIO 1. Sea f : V — W una transformación lineal entre dos K-espacios vectoriales. 
Si v1,...,Un EV yAz,..., An € K, demuestre que 


f(A A y AnUn) = Aif (vr) Ei Anf (Un). 


EJERCICIO 2. Sea T : V — W una función entre espacios vectoriales. Demuestre que T 
es lineal si y sólo si T (au + bv) = aT (u) +bT (v), para cualesquiera a,b € K y u,v € V. 


EJERCICIO 3. Sean U, V, W tres K-espacios vectoriales y sean f : U > W yg: V —= W 
dos transformaciones lineales. Considere los productos cartesianos U x V y W x W. Defina 
la función T : U x V — W x W mediante 


T (u,v) := (f(u), g(v)). 


Demuestre que T es lineal. 


EJERCICIO 4. Sean U, V dos K-espacios vectoriales y defina las funciones 
i:U—>UxV dada por ¿¡(u) = (u, Oy) 


ig: W=UxV dada por iz(v) = (Oy, v). 
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Demuestre que ambas son lineales e inyectivas. 


EJERCICIO 5. Con la misma notación del ejercicio anterior, defina las funciones 
pı:UxV =U dada por pı(u, v) = u 

y 
p:UxV—= V dadapor pa2(u, v) = v. 

Demuestre que son lineales y suprayectivas. 


EJERCICIO 6. Sea V un K-espacio vectorial de dimensión finita y sea T : V —= V una 
aplicación lineal de V en sí mismo. Considere la composición de T consigo misma, i.e., 
T? = ToT : V => V y seaidy : V — V la identidad. Si T? = 0, demuestre que la 
función idy —T : V — V es un isomorfismo. 


EJERCICIO 7. Si f : V — W y g : W — U son isomorfismos de K-espacios vectoriales, 
demuestre que la composición g o f : V — U también es un isomorfismo, con inversa 


(gof =f og: UV. 


EJERCICIO 8. Si g : R? — R? es la función dada por g(x,y) = (£ + y, £ — y). Muestre 
que g es un isomorfismo. 


EJERCICIO 9. Si h : R? — R? es la función dada por h(x, y) = (2x +y, 3x — 5y). Muestre 
que h es un isomorfismo. 


EJERCICIO 10. Si T : R? — R° es la función dada por T (x,y,z) = (£ — y, £ + z, £ + 
y + 2z). Muestre que T es un isomorfismo. 


EJERCICIO 11. Si L : R? — R? es la función dada por L(x, y,z) = (2x — y + z,x£ + 
y, 31 + y + z). Muestre que L es un isomorfismo. 


EJERCICIO 12. Demuestre que cualquier rotación Rọ : R? — R? es un isomorfismo. 
¿Cuál es su inversa? 


EJERCICIO 13. Sea T : Mat2x2(R) — P3(R) la función dada por 


r( ao ) = a+ ba + cr? + drè. 
c d 


Demuestre que T es un isomorfismo. 


EJERCICIO 14. En general, si T : Matmxn(R) — R”” es la función 


a11 Q12 Qin 
Q21 Q22 02n 

T b = (Q11, -< <; Aln Q21,- - -3 An; -3 Am1,- -3 Omn). 
Ami Am2 pre Umn 


Demuestre que T es un isomorfismo. 
EJERCICIO 15. Sea T : P (K) — K"*! la función 
T(ao +12 +--+ ang”) := (49, 41,..., Ap). 


Demuestre que T es un isomorfismo. 
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EJERCICIO 16. Sea A € K un escalar 4 0. Defina T) : K” — K” mediante T) (T) := AZ. 
Demuestre que Ty es un isomorfismo. 


EJERCICIO 17. Demuestre que todas las aplicaciones lineales T : R — R son de la forma 
T(x) = ax, para algún a € R. ¿Cuáles de ellas son isomorfismos? 


2.2. Núcleo e imagen de una transformación lineal 


En esta sección estudiamos unos subespacios asociados a una transformación lineal y 
usando estos subespacios derivamos algunas propiedades de las transformaciones lineales. 
La sección culmina con una fórmula que relaciona la dimensión de los espacios asociados 
a una función lineal entre espacios de dimensión finita. 


Definición 2.8. Sea T : V — W una transformación lineal. Se tienen los conjuntos 
siguientes: 
ker(T) := {vE V : T(v) = 0w} C V. 


Im(T) :=(T(0) EW : ve V} cW. 
Al conjunto ker(T) se le llama el núcleo de la transformación lineal T y al conjunto 
Im(T) se le llama la imagen de la transformación lineal T. 


Proposición 2.9. Sea T : V — W una transformación lineal. Entonces, 


(1) ker(T) es un subespacio vectorial de V. 
(2) Im(T) es un subespacio vectorial de W. 


DEMOSTRACIÓN. (1): Oy € ker(T) ya que T(0y) = Ow. Supongamos ahora que u, v € 
ker(T); entonces T(u) = 0w = T(w) y así T(u+v) = T(u) +T(v) = 0w +0y = 0w, 
i.e., u +v E ker(T). Ahora, si u € ker(T) y à € K, entonces T(u) = Ow y por lo tanto 
T(àu) = AT(u) = A0y = Ow y así Au € ker(T). 

(2): 0w € Im(T) ya que 0w = T(0y). Supongamos ahora que u,v € Im(T”); entonces 
existen u’, v’ € V tales que T(u') = u y T(v') = v, y así T(u' + v’) = T(u) + T(v”) = 
u +v, i.e., u +v € Im(T). Ahora, si u € Im(T) y A € K, entonces existe u’ € V tal que 
T(u”) = u y por lo tanto T(Auw) = AT (u’) = Au y así Au € Im(T). 


Ejemplo 17. Si V = C*([0, 1], R) es el R-espacio vectorial de funciones diferenciables 
en el intervalo [0,1] y si D : V — V es la derivada D(f) = f’, el núcleo de D es el 
subespacio de funciones constantes en [0, 1]. 


Ejemplo 18. Si T : R? — R? es la tranformación lineal T(x, y) = (32 + y, x — 2y) el 
núcleo de T es el subespacio de soluciones del sistema de ecuaciones homogéneo: 

3r+y = 0 

t= 2y = 0. 


Ejemplo 19. Si pryy : R? — R? es la proyección pryy (z, y, z) = (x, y) su núcleo es 
ker(pryy) =£(0,0,2) € R*) = eje Z 


y su imagen es todo R?. 


Por definición de suprayectividad, T : V — W es suprayectiva si y sólo si Im(T) = 
W. Lo que es sorprendente es: 
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Proposición 2.10. Sea T : V — W una transformación lineal. Entonces, T es inyectiva 
si y sólo si ker(T) = {0y }. 


DEMOSTRACIÓN. Si T es inyectiva y v € ker(T'), entonces T(v) = 0w = T(0y) y por 
la inyectividad de T esto implica que v = Oy, i.e., ker(T) = {0y }. Supongamos ahora 
que ker(T) = {0y} y sean u,v € V tales que T(u) = T(v). Entonces, T(u — v) = 
T(u) — T(v) = Ow por lo que u — v € ker(T) = {0y } y así u — v = Oy, i.e., u = v y 
por lo tanto T es inyectiva. 


Para la imagen de una función lineal se tiene: 


Proposición 2.11. Sea T : V — W una transformación lineal. Si B = {v1,..., Un} es 
una base de V, entonces 


ImT = K(T(v1),...,T(un)). 


DEMOSTRACIÓN. Claramente T(v;) € Im T para cada ¿, y como Im T es un subespacio 
vectorial, entonces Im T contiene a todas las combinaciones lineales de los T (v;) y por 
lo tanto K(T(v1),...,T(v,)) € ImT. Para la otra inclusión, si w € ImT, entonces 
existe un v € V tal que w = T(v). Escribiendo a v en términos de la base B, v = 
01U1 +: +: + An Un, Se tiene que 


w=T(w) =T(a101 +--+ anun) 
= aT (01) +::*+a,T(v,) € K(T(v1),... ,T(un)), 
i.e., ImT C K(T(v1),...,T(u,)). 


El resultado siguiente nos dice que una transformación lineal entre espacios de dimen- 
sión finita está determinada por sus valores en cualquier base del dominio: 


Teorema 2.12. Sean V y W dos K-espacios vectoriales, con V de dimensión finita y sea 
B = {v1,.. . , vn } una base de V. Siw1,...,w, son elementos arbitrarios de W, entonces 
existe una única transformación lineal tal que T(v;) = w;, 1 < i < n. Dicho en otras 
palabras: 


(1) Cualquier función de la base B al espacio W se puede extender a una función lineal 


T:V=W. 
(Q) Si T,L : V — W son dos funciones lineales tales que coinciden en la base B, i.e., 


T(v,) = L(vu;), 1 < i < n, entonces T = L en todo V. 


DEMOSTRACIÓN. (1): Existencia. Por hipótesis se tiene una función T : B => W dada 
por T(v;) = wi. Veremos que T se puede extender linealmente a todo V. En efecto, sea 
vv € V cualquier vector. Como B es base de V, existen escalares únicos a;,...,a, en K 
tales que v = a101 ++: ++ + anvn. Se define entonces el vector T(v) € W mediante: 


T(v) :=01T (01) +--+ anT (vn), 


i.e., la combinación lineal dada por los vectores w; = T(v;) € W usando los (únicos) 
escalares a; provenientes de v. Mostraremos que T : V — W es lineal. 


(1) Si v = a101 +-** + anUn y u = biv +--+- + bnn son dos vectores de V escritos en 
términos de la base B, entonces 


v +u = (a1 + b,)01, +--+ (an + bn) Un 
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y así, por definición de T, se tiene: 
Tlv+u) = (a1 +b1)T (01) +--+ (an +bn)T (vn) 
= (aT (01) + bT (01) +--+ (anT (vn) + dy T (0, )) 
= (aT (01) +--+ anT(vn)) + (01T (01) +- +0,T (0, )) 
=T (0) +T(u). 


(11) Si v = 4101 +-:** + nUn y AE K, entonces 
Av = (Aawi +- + (Aa,,)Un 
y así, por definición de T, se tiene: 
T(Av) = Afai )T (v1) +: + (An)T (vn) 
= AlaT (v1) +--+ anT(vn)) 
= AT (v). 


(2): Unicidad. Supongamos que L : V — W es otra transformación lineal tal que coincide 
con T cuando se restringe a B, i.e., L(v;) = T (v;i) para toda i. Entonces, para cualquier 
vector v € V, escribiéndolo en términos de la base de V, v = a101 +--+ + nUn, se tiene 
que 


L(v) = L(aivi +--+ anvn) 


= aL(v,) TA An L(un)) 
= aT (61) +--+ anT(vn)) 
= L(a101 +: + antn) 
=T(v), 


y por lo tanto L = T. 


El resultado siguiente relaciona las dimensiones del núcleo, imagen y dominio de una 
transformación lineal entre espacios de dimensión finita: 


Teorema 2.13. Sea T : V — W una transformación lineal entre espacios vectoriales de 
dimensión finita. Entonces, 


(x) dimx(V) = dim x (ker T) + dimx (Im T). 


DEMOSTRACIÓN. Si ker T = {0y }, entonces dim(ker T) = 0 y T es inyectiva. Se sigue 
que T : V > ImT es un isomorfismo y por el teorema 2.7 se tiene que dim(V) = 
dim(Im T), i.e., (x) es cierta en este caso. 

Si ker T 4 {0y }, sea A = {u1, . . . , Up } una base de ker T. Por 1.38 podemos exten- 
der A a una base de V, digamos {u1,... , Uk, Uk+1,- -< , Un}, si dim V = n. Mostraremos 
que R = [T(ug+1),..., T (un )} es una base de Im T. 


(1) R genera, ya que por 2.11 T(u1),...,T (uk), T(uk+1),---, T (un) generan ImT y 
como T (u1) = --- = T (uz) = Ow, entonces T(ux+1),..., T (un) generan Im T. 


(DR es linealmente independiente, ya que si 


Ow = ak+1T(uk41) +: + anT(un), 
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entonces Ow = T(ax+14x4+1+:**+Qn Un) porque T es lineal. Se tiene así que Ax +1U4x+1+ 
--- + A Un E ker T. Ahora, como u;,..., uz es base de ker T, entonces existen escalares 
01,...,Gj tales que 


QAk+1Uk+1 t't: F anUn = 0141 ++ +++ QgUr. 
Se sigue que 


(—a1)ur +++ + (~ak) Uk + ak+1Uk+1 + + anun = Oy 


y como los u1,..., Un son linealmente independientes, la última igualdad implica que 
todos los a; = 0; en particular ax+1 = :*** = an = 0 y por lo tanto R es linealmente 
independiente. 


Hemos así mostrado que dim(Im T) = n — k, con n = dim V y k = dim(ker T), es 
decir, dim V = dim(ker T) + dim(Im T). 


El espacio vectorial de transformaciones lineales. Si V y W son dos K-espacios vecto- 
riales fijos, denotemos con L(V, W) al conjunto de transformaciones lineales de V a W, 
es decir, 

L(V,W) :={T:V => W : Tes K-lineal]. 
Mostraremos que L(V, W) es un K-espacio vectorial con las operaciones definidas como 
sigue: 


SUMA. Si L,T : V — W son dos aplicaciones lineales, se define su suma L + T como la 
función L+T': V — W dada por 


(L+ TD) (v) := Lw) + T(v), 
usando en el lado derecho la suma de vectores en W. 


PRODUCTO POR UN ESCALAR. Si T € L(V,W) y A € K, se define el producto AT como 
la función AT : V — W dada por 


(AT)(v) := AT (0), 
donde en el lado derecho se tiene el producto de un escalar por un vector en W. 


Proposición 2.14. Sean L, T': V — W dos transformaciones lineales y A € K. Entonces, 
L+T:V —=W y AT : V — W también son lineales. 


DEMOSTRACIÓN. Para L+ T : V —> W: 
(1) Si u,v € V, entonces 
(L+T)(u+v)= L(u+v)+T(u+v) por definición de L + T 
= Lu) + L(v)+T(u)+T(v) porque L y T son lineales 
= (L(u) + T(u)) + (L(v) + T(v)) 
=(L+T)(u)+(L+T)(v) por definición de L + T. 
(11) Si u € V y a € K, entonces 
(L+ Dlou) = Lou 
=aL(u 
= a(L(u) + T(u))) 
=0(L+T)(u) por definición de L + T. 


+T(au) por definición de L + T 


+0T(u) porque L y T son lineales 
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Para AT : V —= W: 
(1) Si u,v € V, entonces 
(AT)(u +v) = A(T(u+v)) por definición de AT 
+T(v)) porque T es lineal 
A(T (v)) 
(AT)(v) por definición de AT. 


(11) Si u € V y a € K, entonces 
AUD (au) = A(T (au) 
= \A(aT (u) 
= (Aa) (T(u)) 
= a(A(T(u)) 
= ANT] 


) por definición de AT 
) 


porque T es lineal 


u) por definición de AT. 


Proposición 2.15. Sean V y W dos K-espacios vectoriales. Entonces, con las operaciones 
anteriores L(V, W) es un K-espacio vectorial. 


DEMOSTRACIÓN. El neutro aditivo de L(V, W) es la función 0 : V — W que manda todo 
al vector Ow y que es lineal por el ejemplo 13. La inversa aditiva de una transformación 
lineal T € L(V,W) es la función -T : V — W dada por (—T)(v) := —T(v), la 
cual es obviamente lineal. Todas las otras propiedades de espacio vectorial se demuestran 
fácilmente y se dejan como un ejercicio. 


Productos directos. Si V y W son dos K-espacios vectoriales, consideremos el producto 
cartesiano V x W de los conjuntos subyacentes. Es decir, 


VxW:=((0,w) : ve V, weW). 
En el conjunto V x W se definen las operaciones siguientes: 
SUMA. Si (v, w), (v”, w’) son dos elementos de V x W, se define 
(0,0) + (0,0) := (v +v, w+ w’) 


observando que en el dado derecho, v+v” € V y w+w' € W, por lo que (u+v”,w+w”) € 
VxWw. 


PRODUCTO POR UN ESCALAR. Si (v, w) € V x W y A € K, se define 
Av, w) := (Av, Aw), 
observando que en el lado derecho, Av € V y Aw € W, por lo que (Av, Aw) € V x W. 


Se verifica fácilmente que V x W es un K-espacio vectorial (ejercicio 19), con neutro 
aditivo el elemento (Oy, 0w) y si (v, w) € V x W, su inverso aditivo es (—u, —w). 


Sumas directas y productos directos. En la sección 51.3 hemos definido y estudiado la 
suma directa de dos subespacios vectoriales V y W de un espacio vectorial U. Observamos 
ahora que en la definición de producto directo sólo requerimos que los factores sean dos es- 
pacios vectoriales, no necesariamente subespacios de otro espacio, por eso siempre se tiene 
definido el producto directo de dos espacios y la suma directa no siempre está definida ya 
que requiere que los espacios involucrados sean subespacios de otro espacio. ¿Qué sucede 
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si se tienen dos subespacios vectoriales V, W E U y consideramos su suma directa V p W 
y su producto directo V x W? 


Proposición 2.16. Sean V, W subespacios de un K-espacio vectorial U. Entonces, la 
función natural 
T:WxW=>V0Ww 
dada por T (v, w) := v + w, es un isomorfismo. 
DEMOSTRACIÓN. (1): T es lineal ya que: 

(1) Si (v, w), (v', w) € V x W, entonces (v, w) + (v', w’) = (v +v’, w + w’) y así 
T((v, w) + (v, w)) =T(v +v, w+ w) = (v+ v) + (w+w”) 
=(v+w)+ (v +w) 
= T(v,w) + T(x, w’). 


Gi) Si (v, w) € V x W yA € K, entonces A(v, w) = (Av, Aw) y así 
T(A(v, w)) = T (àv, Aw) = Av + àw 
= (v+ w) 
= AT (v, w). 


(2) : T es inyectiva. Para probar esto, mostraremos que ker T = { (0y, 0y )}. Sea (v, w) € 
ker T; entonces T(v, w) = Oy y así, 0y = T(v,w) = v + w implica que v = —w y 
por lo tanto v, w € V N W. Pero como V N W = {0y}, entonces v = Oy = w, i.e., 
(v, w) = (Oy, Oy). 


(3) : T es suprayectiva. Esto es claro que si v + w € V W, entonces v € V yw € W, 
por lo que (v, w) € V x W satisface que T (v, w) = v + w. 


EJERCICIO 18. Demuestre las propiedades faltantes para ver que L(V, W) es un K-espacio 
vectorial. 


EJERCICIO 19. Compruebe que V x W es un K-espacio vectorial. 


EJERCICIO 20. Si V y W son K-espacios vectoriales de dimensión finita, demuestre que 


EJERCICIO 21. Si f : V — W es una aplicación lineal inyectiva, demuestre que f : V —= 
Im(f) es un isomorfismo. 


EJERCICIO 22. Si f : V — W es una transformación lineal inyectiva y dimx(V) = 
dimx(W) < oo, demuestre que f es un isomorfismo. 


EJERCICIO 23. Si V y W son espacios vectoriales de dimensión finita, f : V — W es 
lineal y dimx(V) > dimx(W), demuestre que f no puede ser inyectiva. 


EJERCICIO 24. Si V y W son espacios vectoriales de dimensión finita, f : V — W es 
lineal y dimx(V) < dimx(W), demuestre que f no puede ser suprayectiva. 
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EJERCICIO 25. Si V y W son dos K-espacios vectoriales de dimensión finita, tales que 
dimx(V) = dimx(W), demuestre que V y W son isomorfos. 


EJERCICIO 26. Suponga que V y W son dos espacios vectoriales de dimensión finita y 
dimx V = dimx W. Si f : V — W es lineal, demuestre que f es inyectiva si y sólo si f 
es suprayectiva. 


EJERCICIO 27. Sea V = C% ([0, 1], R) el R-espacio vectorial de funciones diferenciables 
en [0,1] y sea D : V — V la derivada D(f) = f’. SiT = D — idy : V —> V, calcule su 
núcleo. 


EJERCICIO 28. Sea V como en el ejercicio anterior y fijemos un real A € R. Si T = 
D — åA- idy : V —> V, calcule su núcleo. 


EJERCICIO 29. Sea V = Matnxn( K) y sea T : V — V la función 


(1) Calcule el núcleo de T. 
Gi) Calcule dim xx (ker T). 


EJERCICIO 30. Sean U, W subespacios de V y sea T : U x W — V la función T(u, w) = 
u— w. 
(1) Muestre que T es lineal. 
(11) Calcule el núcleo de T. 
(111) Calcule la imagen de T. 


EJERCICIO 31. Sea P : V — V una transformación lineal tal que P? = P (donde 
P? := Po P). Demuestre que V = ker P Ẹ Im P. Sugerencia: si v € V, entonces 
v = (v — P(v)) + P(v). 


EJERCICIO 32. Sean U, W subespacios de V y considere las funciones 1, : U — U p W 
eiz : V — U W dadas por i (u) = u = u + 0y e iz(w) = w = 0y + w y las funciones 
pı: USW —Uyp:UW — W dadas por pı (u + w) = u y palu + w) = w. 
Claramente t; e 22 son lineales e inyectivas. 

(1) Muestre que pı y pa están bien definidas, son lineales y suprayectivas. 

(11) Muestre que Im 2, = ker pı e Im 12 = ker pə. 


2.3. Transformación lineal asociada a una matriz 


Si K es un campo y V y W son dos K-espacios vectoriales de dimensiones finitas, 
digamos dimx(V) = n y dimx(W) = m, podemos en forma natural preguntarnos cuál 
será la dimensión del espacio vectorial L(V, W) de transformaciones lineales de V a W. 
En esta sección comenzamos a estudiar este espacio vectorial, importante porque incluye a 
todas las transformaciones lineales de V a W, para culminar en la sección siguiente donde 
mostramos que L(V, W) es isomorfo al espacio vectorial de matrices Mat,» xn (1). Esto, 
de paso calcula la dimensión de L(V, W), pero además nos dice concretamente quiénes 
son sus elementos, las matrices m x n con entradas en el campo K, salvo la identificación 
que hace el isomorfismo correspondiente. El objetivo de esta sección es proveernos con una 
función de Matmxn( K) a L(V, W), para dos espacios vectoriales de los cuales sabemos 
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que tienen dimensiones n y m obviamente, a saber, K” y K””, y para esto, necesitaremos 
conocer una nueva operación con matrices que no hemos estudiado hasta ahora: el producto 
de matrices. Comenzamos con esto. 


2.3.1. Producto de matrices 


Si K es un campo, ya vimos que el conjunto de matrices Mat xn (4) es un K- 
espacio vectorial. Así, podemos sumar matrices (entrada por entrada) y multiplicarlas por 
un escalar (entrada por entrada). En este punto, podríamos preguntarnos si habrá una ma- 
nera de multiplicar matrices que satisfaga las propiedades que uno podría esperar. Para 
comenzar, es claro que deben haber ciertas condiciones sobre las matrices para que las po- 
damos multiplicar, por ejemplo, para sumar dos matrices requerimos que sean del mismo 
tamaño m x n para que al sumarlas se pueda hacer componente a componente y se obten- 
ga al final una matriz del mismo tamaño que las dadas. Así, para multiplicar matrices uno 
inicialmente pensaría que las dos matrices deben ser del mismo tamaño para poder multi- 
plicarlas entrada por entrada. Muchas propiedades algebraicas son válidas con el producto 
definido componente a componente, sin embargo, desde el punto de vista del desarrollo 
de la matemática, éste no es el producto de matrices que aparece naturalmente en varias 
contextos de la matemática. Por ejemplo, si recordamos que las matrices están asociadas a 
sistemas de ecuaciones lineales, pensemos a estos sistemas como transformaciones lineales 
como sigue: si L : R? — R? es la transformación lineal dada por 


L(01, 22,23) = (£1 + 23, £1 + 22 + 23) 
y si T : R? — R? es la transformación lineal 


T(y1, Y2) = (2y1 — Ya, Y1 + Y2), 


si denotamos con 7 = (x1, £2, £3) € R? y Y = (y1, ya) € R?, la función L : R? — R? la 
podemos escribir como 


Tı T La Yı 


zı + T2 tT3 = Y2 


y la matriz asociada a este sistema es: 


10 1 
B=( 1 a: 


Similarmente, escribiendo y = (y1, y2) en el dominio y Z = (z1, z2) en el codominio, la 
función T : R? — R? está dada por 


2y- y = 2 
yı ty = 22 


2 —1 
Za 
Consideremos ahora la composición T o L : R3 — R? que está dada por 
(T O L) (£1, £2, 23) = T(L((x1, £2, 13)) 
= T (x1 + 23,21 + £2 + 23) = T(y1, y2) 
= (2 (x1 + z3)— (zı + z2 + z3), (xı + 23)+(x1 + T2 + 23)) 


E (21, 22), 


cuya matriz asociada es: 
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lo cual nos da el sistema de ecuaciones lineales 


2(11 + 23) — (21 + £2 + 23) = 21 
(11 + x3) + (z1 + £2 +723) = 2 
que simplicado es: 
£ı — T2 + T3 = 1 
211 + £2 + 223 = 2 


cuya matriz asociada es 
1 -1 1 
e ( E AR ) 
y es natural que uno quiera que C sea el producto de las matrices A y B, es decir, Č = AB. 
Lo primero que observamos es que A es 2 x 2, B es 2 x 3 y C es 2 x 3. Luego, para 


ver cómo se obtiene C a partir de B y A, escribamos los sistemas de ecuaciones anteriores 
en general: 


(e) El sistema correspondiente a cualquier transformación lineal L : R? — R? es: 


4111 + 0122 + 333 = Yı 
0421%1 + A22%2 + UA23%3 = Y2 


011 Q12 41 
B= Sri 
421 Q22 Q23 
(e) Similarmente, el sistema correspondiente a cualquier transformación lineal T : R? — 
R? es: 


con matriz asociada 


biyi +bi9Y = 21 
b21Y1 + b2242 = 22 


bii Dia 
A= : 
( b21 Daz ) 


(e) Entonces, la composición T o L : R? — R? tiene el sistema: 


con matriz asociada 


bi1(a11%1 T 0122 + 41303) DE bi2(a91%1 T 0222 + 42303) = 21 
ba1(a11%1 T 0122 + 41303) ag ba2 (049101 T 0222 + 42303) = 22 


que al simplificarlo nos da la matriz asociada 
C11 C12 C13 
C= ; 
C21 C22 C23 


C11 = b11011 + b12021 + ba1011 + b22021, 


donde, por ejemplo, 


el cual vemos que involucra las entradas del primer renglón (b11, b12) de A, y las entradas 
a11 


de la primera columna ( 
421 


) de B, y así podemos escribir 


C11 = (b11,b12) ( Ta ) 


a21 
donde el producto del renglón por la columna (que son del mismo tamaño) se hace com- 
ponente a componente y luego se suman los resultados para obtener c11. 
El lector puede verificar que las otras entradas c;¿ de la matriz C = (c;¿) se obtienen 
de la misma manera, es decir, 


cij = (Renglón i de A) - (Columna j de B) 
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donde en la derecha de la igualdad anterior se tienen vectores del mismo tamaño y el 
producto quiere decir que es componente a componente y luego se suman los resultados 
para obtener c;;. 

La condición necesaria para poder hacer el producto de matrices anterior es: el renglón 
i de A debe tener el mismo tamaño que la columna j de B. Estas observaciones se resumen 
en la definción siguiente: 


Definición 2.17. Si A = (aij)mxt y B = (bij)txn son dos matrices con entradas en un 
campo K y satisfacen que: 


(x) número de columnas de A = número de renglones de B, 


entonces se define el producto de matrices AB como la matriz C = (Cij)mxn cuyas 
entradas c;j están dadas por la fórmula 


(t) cij = (Renglón i de A) - (Columna j de B), 


donde en la derecha de la igualdad anterior se tienen vectores del mismo tamaño t porque 
el número de columnas de A nos da el número de componentes de un renglón de A y el 
número de renglones de B nos el número de componentes de una columna de B. Por eso, 
al pedir la condición (*) garantizamos que el producto componente a componente en (f) se 
pueda hacer, para después sumar los resultados para obtener c;;. Explícitamente, 


bas 
j 
Cij = (di1, Qiz,- - , Ait) ° : = 01015 + Oj2boj + +: + Qitbij = > Qikbkj- 
; k=1 
bij 


Observe que como A tiene m renglones y B tiene n columnas, hay mn posibilidades 
para las entradas c;;j y por eso la matriz C = AB es de tamaño m x n. 


Observación. Si A es m x t y Bes r x n, de acuerdo a la definición anterior, el producto 


AB se puede realizar si y sólo si t = r. 


Ejemplo 20. Para las matrices del ejemplo que nos sirvió de motivación para definir el 
producto de matrices: 


2 1 101 
a=( El y B=(; 1 i 


se tiene que 
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Ejemplo 21. Multiplique las matrices 


3 2 
2 1 2 3 4 
AN gne To T. a 
1 4 
se tiene que 
3 2 
2 1 2 3 4 
AE Je -2 ) 
1 4 
3(2+2(1) 3(3)+2(-2) 3(4) +2(5) 
| 24)+10) 28) +12) 2(4) + 1(5) 
"100-106. 08-12) 014216) 
1(2) +4(1) 1(3)+4(-2) 1(4) + 4(5) 
8 5 2 
|5 4 8 
T| -1 2 -5 
6 -5 9 


Note que en el ejemplo anterior A es 4 x 2 y B es 2 x 3, por eso está definido el 
producto AB y es 4 x 3. Sin embargo, el producto BA no está definido porque el número 
de columnas de B es 3 que no es igual al número de renglones de A que es 4. Así, en este 
ejemplo ni siquiera tiene sentido preguntar si AB = BA. Veamos algunos ejemplos donde 


esta pregunta tenga sentido: 
1 0 —1 
L] ) yB= ( 9 3 ) Entonces, 


2 
0 
o 48 0 1 
aB= (> ES) o Ba= (2, A 


por lo que AB Æ BA. 


Ejemplo 22. Sean A = ( 


E 1 4  (f1.0 
Ejemplo 23. Sean A = ( 2 3 ) yB= ( 01 ) Entonces, 
1 4 
an= (2, $) =n 


Así, aun cuando AB y BA estén ambas definidas, puede suceder que AB 4 BA o 
que AB = BA. Decimos que el producto de matrices, en general, no es conmutativo. 
Que el producto sí es asociativo, cuando esté definido, es el contenido de la proposi- 
ción siguiente: 
Proposición 2.18. Si Aesmxr, BesrxtyCestx n, entonces AB esm x t y 
así (AB)C está definida y es m x n. También BC es r x n y así A(BC,) está definida y 


esm x n. Se tiene que 


(AB)C = A(BO). 
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DEMOSTRACIÓN. Pongamos A = (aij), B = (bij) y C = (cij). Entonces, el producto 


AB = (dij) está dado por 
dij = 5 Qikbkj 
k=1 


P 
> Qikbke | Cej 


y así el producto (AB)C = (e,¿) está dado por 
] 
k=1 


t 
eij = > digcej = > 
£=1 £=1 
t g 
= > > QikbkeCej- 


f=1 k=1 


Por otra parte, si BC = (fij) con 


t 
f= > bieCej, 
t= 


entonces A(BC) = (gij) está dada por 


r r t 

Jij = > Qik fkj = > Qik > bkeCej 
k1 k=1 f=1 
t 

= > QikbkeCej. 


Observamos entonces e;j = gij, para toda ¿ y toda j, por lo que (AB)C = A(BC). 


La propiedad distributiva del producto con respecto a la suma se obtiene de la misma 


manera: 
Proposición 2.19. Si Aes mx t, B yC sontxn, entonces B+C estxnyasí A-(B+C) 


está definida y es m x n como lo son AB y AC. Además se tiene que 
A(B +C) = AB + AC. 


DEMOSTRACIÓN. Pongamos A = (a;;), B = (bij) y C = (cij). Entonces, B + C 
(bij + cij) y así A(B + C) = (dij) está dada por 
t t P 
) = 5 Qikbkj + y OikChj- 
k=1 k=1 


(1) dij = 5 Qik(bkj + Crj 
k=1 
Por otra parte, AB = (e;;) y AC = (fij) están dadas por 


t t 
ij = > Qikbkj Y fij = > QikCkj 
k=1 k=1 


y así AB + AC = (eij + fij) donde 
t t 
eij + fij = 5 Qikbkj + 5 QikCkj- 
k=1 k=1 


(2) 
Observando que (1) y (2) son iguales se sigue que A(B + C) = AB + AC. 
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La matriz transpuesta de un producto es el producto de las transpuestas en orden in- 
verso: 


Proposición 2.20. Si A esm x ty Best x n, entonces *Besnxty*Aestx m por lo 
que * B* A está definido y se tiene que 


(AB) =*B'A. 


DEMOSTRACIÓN. Pongamos A = (aij) y B = (bij). Entonces, AB = (cij) está dada por 


t 
(1) Cij = X aikbrj. 
k=1 


Ahora, si ponemos "A = (a};) y *B = (bip) con apj = ajg Y diz = bri, entonces 
t B'A = (dji) está dada por 


t t 
(2) dij = y Dix A; = 5 bkiūjk- 
k=1 k=1 


Finalmente, si (AB) = (cj) con cj; = Cji, las igualdades (1) y (2) nos dicen que 


hs = Cji = dij, es decir, (AB) =*B*A. 


Cij 


La matriz identidad. Para cada n € N la matriz f,, que tiene unos en la diagonal y ceros 
en las otras entradas se llama la matriz identidad n x n: 


10 e O 

0 1 0 > 0 
Tym Sa 

O --- 0 1 0 

0 0 >. 0 1 


La propiedad más importante de las matrices m es que son neutras para el producto 
de matrices: 


Proposición 2.21. Si A € Matmxn( K), entonces: 
DAI =A 
D) Im A= A. 


DEMOSTRACIÓN. (1): Pongamos A = (a;;) e In = (9,5), donde 
5.. = 1 sii=j 
210 siifj 


Entonces, Al, = (c,¿) está dada por 


Cij = 5 Uk Op» 
k=1 
donde 
f T Qij si k = J 
cub = d 0 sik#j, 
por la definición de ĝ;;j. Se sigue que 


n 
Cij = > Qikôkj = Qij 


k=1 
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y por lo tanto AJ, = A. El caso (2) es similar. 


Observe que, en la proposición anterior, en general tienen que usarse matrices Im € In 
distintas a la izquierda y a la derecha de A porque A no tiene por qué ser cuadrada. Si la 
matriz A fuera cuadrada n x n, entonces la proposición anterior diría: 


Alr = A=1,A 
y por lo tanto la matriz /,, funcionaría como neutra multiplicativa a la izquierda y a la 
derecha de A. 
Matrices invertibles. Si A es una matriz cuadrada n x n, diremos que A es una matriz 
invertible si existe otra matriz B tal que 

AB = In, = BA. 


Note que B debe ser entonces también n x n. A la matriz B la llamaremos una inversa de 
la matriz A. 


Lema 2.22. Si A es una matriz n x n invertible, entonces su inversa es única. 
A la única inversa de A la denotaremos por A7?, 


DEMOSTRACIÓN. Supongamos que B y C son matrices n x n inversas de A. Entonces, 
AC = In = BA y así 


B = BI, = B(AC) = (BA)C = „C = C. 


EJERCICIO 33. Suponga que A,B € Matnxn(K) son matrices invertibles. Demuestre 
que AB es invertible. 


EJERCICIO 34. Si A es una matriz diagonal n x n: 


am 0. + 0 
0 092 0 0 
A == : Ey ; 
0 pat 0 QAn—1,n—1 0 
0 a 0 Ann 
y además as; 4 0 para toda ¿ = 1,...,n, demuestre que A es invertible. ¿Cuál es su 


inversa? 


EJERCICIO 35. Suponga que A es una matriz cuadrada invertible. Demuestre que su trans- 
puesta también es invertible y además 


t(A7)) = LAR 


EJERCICIO 36. Si A € Mata xn (K) es una matriz cuadrada, entonces 
A?=A-A tambiénesn xn, 
AF=A?*.A tambiénesnx n, 

y, usando inducción se define 


A”=A"1.A quetambiénesn x n 
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y, por convención, se pone A? = I„. Demuestre la regla de los exponentes: 
AF = A" . At, r,t>O0enteros. 


Sugerencia: fije el entero r y haga inducción sobre t. 


EJERCICIO 37. Si A, B € Matnxn( K) y además AB = BA, demuestre que 


(A+ B}? = A?+24B+ B°. 


EJERCICIO 38. Sea A = ( cosð  —send ) 


senó  cosð 


a Calcule 4?. 
a Calcule 4?. 
a Calcule 4”, para todo entero m > 0. 


EJERCICIO 39. Si A es una matriz diagonal n x n: 


y O 0 
0 092 0 Eeg 0 
A = 
0 0 An—1,n—1 0 
0 0 Ann 
calcule 4?, 43,..., A”, para toda m > 0. 


EJERCICIO 40. Sea A = (aij) una matriz cuadrada n xn, triangular superior estrictamente, 
i.e., aij = 0 para toda i > j. Demuestre que A” = 0. Sugerencia: use inducción sobre n. 


EJERCICIO 41. Una matriz cuadrada A se dice que es nilpotente si A* = 0 para algún 
entero k > 1. Así, el ejercicio anterior nos dice que una matriz triangular superior estricta, 
es nilpotente. Suponga ahora que A, B € Mata xn(K) son matrices nilpotentes tales que 
AB = BA. 


= Demuestre que AB es nilpotente. 
= Demuestre que A + B es nilpotente. 


EJERCICIO 42. Encuentre todas las matrices A € Mato, 2(K) tales que 4? = 0. 


EJERCICIO 43. Demuestre que el producto de matrices saca escalares, es decir, si A € K, 
Aesmxty Best x n, demuestre que 


VA)B=XAB) = AMB). 
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2.3.2. La transformación lineal asociada a una matriz 


Si se tiene una matriz A € Matmxn( K), digamos 


011 Q12 ++ Qin 
021 Q22 *::  02n 
A= , 
Am1 Am2 aar Amn 
los renglones de A son vectores R; = (ail, Qi2,..., Qin) E€ K”, y así, para el vector 
columna 
Tı 
T2 
T= A 
Tn 


011 qr12 ce: Aln Tı 
n: a21 Q22 *::  02n T2 
A-T= 
Am1 Am2 aa Amn sen Tn nxi 


y es una matriz m x 1, es decir, es un vector columna A -T € K™. Hemos definido así una 
función 
Ta :. K” E 


mediante la regla: T4(T) := A - T, pensando al vector T € K” como un vector columna 
o matriz n x 1. 


Proposición 2.23. Si A € Matmxn(K), la función Ta : K” — K” es una transforma- 
ción lineal. 


DEMOSTRACIÓN. (i): Si Z, y € K”, entonces 
Ta(z + y) = A(z + y) = Alz) + A) = Talz) + Taly), 


porque el producto de matrices satisface la ley distributiva. 


Gi): Size K” y A € K, entonces 
Ta (AT) = A(AT) = AA(T) = A(T) = ATA (T), 


porque el producto de matrices saca escalares, por el ejercicio 43. 


La proposición anterior nos dice que se tiene una función 
9: Matmxn (K) > L(K”, K™) 


que a cada matriz A de tamaño m xn, le asocia una transformación lineal T4 : K” = K”. 

Sabemos que Matmxn( K) y L(K”, K™) son espacios vectoriales y es natural pre- 
guntarnos si la función Y es lineal. Probaremos más adelante que esta función es, de hecho, 
un isomorfismo de espacios vectoriales, y comenzamos con: 


Proposición 2.24. La función ® : Matmxn( K) > L(K”, K"), dada por B(A) = Ta 
es lineal e inyectiva. 
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DEMOSTRACIÓN. (1): Si A, B € Matmxn(K), para ver que Tay = Ta + Tsg sólo de- 
bemos mostrar que tienen los mismos valores en cualquier T € K”. Para esto observemos 
que 
Ta+B(3) =(A+B)-7 por definición de T448 
=A:T+B-ZT por distributividad 
= Ta(z) + Tp() por definición de Ta y Tp 
= (Ta + Tg)(®) por definición de suma en L(K”, K”). 
(2): Si A € Matmxn( K) y à € K, para mostrar que Tya = ATA, debemos probar que 
tienen los mismos valores en cualquier z € K”. Para esto observemos que 
Dra(z) = (AA) (T) 
= A( AT) 
= (AT4) (©). 
(3): Para mostrar que ® es inyectiva, debemos mostrar que ker(®) = {0}, donde 0 es la 
matriz cero m x n. En efecto, si A € Matmxn(K) es tal que Ta = 0 : K” > K”, 
entonces T4 es la transformación lineal cero, i.e., manda todos los vectores de K” en el 
vector cero de K™. En particular, si E, son los vectores columna de K” que tienen un 1 


en el lugar j y cero en las otras componentes, entonces T4 (E;) = 0. Observemos ahora 
que, si A = (a,;), entonces 


Ta (E;) = AE; = columna j de la matriz A = 0 


y por lo tanto todas las columnas de A son cero, i.e., A = 0. 


Para mostrar que $ es un isomorfismo sólo nos falta probar que ® es suprayectiva. 


Teorema 2.25. Sea T : K” — K” una transformación lineal. Entonces, existe una (única 
matriz) A € Matmxn( K) tal que T = Ta, i.e., D es suprayectiva. 


DEMOSTRACIÓN. Sea A = {E;,..., En} la base canónica de K”, donde cada E, lo 
vemos como un vector columna. Sea B = {e1,..., €m} la base canónica de vectores 
columna de K™. Como A es base de K”, todo vector columna x € K” se puede escribir 
en forma única como combinación lineal de los Ej: 


T= tE +: EnEn, 


donde los coeficientes xj son las componentes de 7. Como T es lineal, al aplicarla a z 
obtenemos 


(x) T(T) = 21T (E1) +- + 2n T (En). 
Por otra parte, cada T(E;) € K”™ se puede escribir en términos de la base B, es decir, 
T(E¡) = ar1e1 + a21€2 +*+: + Amilm 
T(E2) = a12€1 + a22€2 + ` ` © + Am2lm 


T(En) = ainel + anez + `- © + amnem, 
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donde las a;;, 1 < 1 < m, son las componentes de T(E;), es decir, 


411 412 din 

021 022 02n 
a A EES A A O da 

m1 Am2 Umn 


y por lo tanto, substituyendo estos valores de T(E) en (x) obtenemos 


a11 Q12 Aln 
a21 Q22 02n 
T(T) = zı + z2 +---+2p 
Am1 Am2 Amn 
a11 012 Qin Tı 
a21 Q22 02n T2 
Am1 Am2 AAR Amn Tn 


= Ar, 


con Á = (aij)mxn, y así T = T4. La unicidad de A es por la proposición anterior. 


Resumiendo, hemos probado que la función 
9: Matmxn( K) > L(K”, K”) 


dada por A > T4 es un isomorfismo de espacios vectoriales. Este isomorfismo nos permite 
pensar a una matriz A de tamaño m x n como una transformación lineal T4 : K” —> K™ 
y recíprocamente, cada transformación linea de K” en K™ la podemos pensar como una 
matriz m x n. Una observación final, como dim g Matmxn( K) = mn, el isomorfismo ® 
nos dice que dimx L(K”, K™) = mn también. 


Ejemplo 24. Si A = ( P ES ) € Mat2x3(R), la transformación lineal asociada 
z 
Ta : R3 — R? está dada, parau = | y |, por 
2 
as T 7 2x — 3y +z 
OS 1.0 -2 ) 7 -( z- 2z ) 


z 
El núcleo de esta transformación lineal está dado por 


ker(T4) = {v E€ R? : Ta(v) =0 € R°} 


= feyz) ER Co ne ( o J) 


es decir, ker(T'4) es el subespacio de soluciones Sy, del sistema de ecuaciones homogéneo: 
21-3y+2=0 
x—2z=0. 
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Sistemas de ecuaciones lineales y la transformación lineal asociada a una matriz. Si 
tenemos un sistema de ecuaciones lineales homogéneo: 


41171 + 4122 + `: + ainn =0 


42121 + 022%2 + -** + 497 Tp = Q 


Am1T1 + am2£2 + `+ © + AmnTn =0, 


con coeficientes a;j en un campo K, y si consideramos la matriz de coeficientes 


Q11 qa12 res Qin 

021 Q22 ce: 02n 
A = 

Am1 Am2 o Amn 


a la cual llamaremos la matriz del sistema, y el vector de incógnitas: 


Tı 
T2 


Tn 
el sistema de ecuaciones anterior se puede escribir como 
(1) A-2=0 


donde 0 es el vector (columna) cero de K™. En términos de la transformación lineal aso- 
ciada a la matriz A, el sistema de ecuaciones anterior se escribe como 


(2) Ta(z) =0, 


es decir, el conjunto de soluciones S, del sistema homogéneo (1) es el núcleo de la trans- 
formación lineal T4: 

Sh = ker(Ta) EK” 
y resolver el sistema (1) es calcular el núcleo ker(T4), del cual ya sabemos que es un 
subespacio vectorial de K” y así, para determinarlo basta dar una base de este subespacio. 


En la sección 83.3 daremos un método que nos provee de una base de ker(Ta). 
¿Qué sucede si tenemos un sistema no homogéneo de ecuaciones lineales? Sea 


01171 + 41922 +*+: F AinTn = b1 


02171 + a22%2 + `: + 299 Tn = ba 


Am1T1 + Am2%2 + *** + QAmnTn = bm, 


un sistema de ecuaciones lineales con coeficientes a;; y términos independientes b; en un 
campo K. Consideremos la matriz del sistema formada con los coeficientes a;j: 


Q11 Q2 t Aln 
a21 IS 02n 


AmI Am2 FeS Amn 
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y la transformación lineal T4 : K” — K™ asociada. En términos de la transformación 
lineal T4, el sistema de ecuaciones anterior se escribe como 
A 


(3) Ta(z) =b, 
Tı bi 
T2 z ba 

donde T = 3 es el vector de incógnitas y b = i E€ K™ es el vector 
Tn bm 


(columna) de términos independientes en K™. Así, el sistema (3) tiene una solución si y 
sólo si existe T € K” tal que T4 (T) = b, es decir, si y sólo si b € Im (Ta). 

Así, para resolver el sistema no homogéneo (3), ya que lo primero que tenemos qué sa- 
ber es si tiene o no soluciones, entonces lo primero que debemos hacer es determinar si el 
vector b pertenece o no a la imagen Im (T4) y para esto necesitamos una descripción del 
subespacio Im (Ta ), dando de preferencia una base de este subespacio, que como veremos 
en 3.2, esencialmente está contenida en proposición 2.11. 


2.4. Matriz asociada a una transformación lineal 


Dada una transformación lineal T : V — W entre espacios vectoriales de dimensión 
finita, dimx(V) = n y dimx(W) = m, si A y B son bases de V y W, respectivamente, 
en esta sección mostraremos cómo, usando las bases A y B, le hacemos corresponder a T 
una matriz en Matmxn( K). Recordemos ahora que en la sección anterior mostramos que 
se tiene un isomorfismo 


9: Matmxn( K) > L(K”, K”); 
en esta sección estableceremos primero un isomorfismo 
Y: L(K”, K™®) > L(V,W) 


y luego se compondrá con el isomorfismo $ para obtener la correspondencia entre L(V, W) 
y Matmxn( K) deseada. 


El isomorfismo Y es inducido por isomorfismos K” — V y K™ — W dados por 
las bases las bases escogidas para V y W. Comenzamos con esto. Sea V un K-espacio 
vectorial de dimensión n y sea A = {v1,..., Un} una base de V y escojamos un orden 
entre estos vectores de la base (diremos entonces que A es una base ordenada de V). 
Entonces, todo vector v de V tiene una expresión única de la forma 


V = 0181 +:** + QMnUn 
(los a; € K están unívocamente determinados por v y la base A). Diremos que a1, . . . , an 
son las coordenadas de v con respecto a la base A y lo denotamos mediante 
[ula = [a1,...,anja. 


Note que las coordenadas a1,..., a, forman una n-ada ordenada en K” ya que cada a; 
corresponde al vector básico v; y los vectores básicos están ordenados por hipótesis. 


Lema 2.26. Sea A = {v1,..., Un} una base ordenada de V, y denotemos la corres- 
pondencia que asocia a cada vector v € V sus coordenadas [a;,...,an]a en la base A 
mediante 

DA: V> K”, 


i.e., ġa está dada por p4 (v) := [a1,..., an]... Entonces, 4 es un isomorfismo. 
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DEMOSTRACIÓN. (1): $, es lineal, ya que 
(1) Si u,v € V, esribiéndolos en la base A como 
Uu = 04107 +H:::*+AnO0n Y v= biv +++: +0b,Un, 


entonces 


u +v = (a1 + b1)01 +++ + (an + bn)Un 
y así 
palu +v) = [(a1 +01), ..., (an + bn)]a 
= [41,...,OnJa + [bi,..., bnl A 
= ġa(u) + ġa(v). 


O Siu € V yà € K, escribiendo u = aiv + -+ + anun, entonces Au = (Aai )wi + 
«+++ Aan Wn, por lo que 


palu) = [(àa1),. (Aan) a 


= Alai, ..., anl] A 
= àġa (u). 
(2) ġ4 es suprayectiva porque si (a1, ..., an) € K”, el vector v = 4101 +--+ + 4 Uy es 


tal que ġa (v) = (a1,..., an). 


(3) Como ġa : V — K” es lineal suprayectiva entre espacios vectoriales de la misma 
dimensión, entonces es un isomorfismo. De hecho, la inyectividad de ġ4 es directa ya que 
los coeficientes a; de v son únicos (sólo dependen de la base). 


Regresemos ahora al problema original: sean V y W dos espacios vectoriales de di- 
mensiones finitas sobre un campo K. Sean 


A=401,.-.,0n) y B=4w1,...,Wm) 

bases de V y W respectivamente. Por el lema anterior se tienen isomorfismos 

ġa: V> K” y øg: W >K” 
con inversas 

VA K” >V y yg: K” >W 
dadas por 

palai... an) := 0101 +:::*+anO0n Y Ygelbi,...,bm):= biwi ++: + bmWm 

respectivamente. 


Para establecer el isomorfismo deseado entre L(V, W) y L(K”, K™), procedemos 
como sigue: 

Sea T : V — W una transformación lineal. Usando los isomorfismos anteriores, 
tenemos un diagrama como el que sigue: 
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T 


V W 


PA PA VB PB 


KP iii EM 
T 


donde la flecha punteada T” : K” —= K”™ es la transformación lineal que queremos aso- 
ciada a T : V — W. Mirando este diagrama, la definición de T” salta a la vista: como 
T' : K” — K”” es la función lineal que queremos, viendo el diagrama anterior, para ir de 
K” a K”, lo natural es ir primero de K” a V usando Y 1, luego de V a W usando T y 
finalmente de W a K”” usando ¢ġg; es decir, la función T” debe ser la composición 


V W 
val |» 
K” > km 


T 


T' = ġgoToypa. 
Explícitamente, si v € V, pongamos w = T (v) € W y consideremos sus coordenadas 
con respecto a las bases correspondientes: 


ula =[a1,...,an]1a E K” y [w]g = [bi,...,bm]g € K”. 
Entonces, T” : K” — K”™ está dada por 
T'(a1,..., an) := (b1, ..-, bm). 


Observe que como T” = Hg o T o %4 y todas las funciones del lado derecho son lineales, 
entonces T” también es lineal. Una observación más: como %4 y Hg son isomorfismos, el 
diagrama anterior identifica a T : V — W como la función lineal T” : K” = K”. 


Proposición 2.27. Sean V y W dos K-espacios vectoriales de dimensiones finitas n y m, 
con bases A y B, respectivamente. La correspondencia anterior, que a cada T € L(V, W) 
le asocia T' = ġg o T od, € L(K”, K™), es un isomorfismo. 


DEMOSTRACIÓN. Denotemos con © : L(V,W) —> £(K”,K"”) a la correspondencia 
anterior. Mostraremos que O es lineal. En efecto, si T, L € L(V, W) son dos aplicaciones 
lineales, entonces T’ = g o T o pa y L’ = pg o L o ypa. Se sigue que 


T'+L' =¢ġgoT opa + pgoLopa 

= (¢goT + go L)oypa 

= ġg o (T + L) o Ya 

= (T+ LY. 

Si T € L(V,W) y A € K, entonces 
AT =A ($g Topa) 

= ($g o (à: (T o pa)) 
= ġgo (A-T) o pa 
=(T+ LY. 
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La función O es inyectiva, ya que si T” = 0, entonces 0 = ¿go T o va, y como dg 
es un isomorfismo, la igualdad anterior implica que T o 44 = 0 y de nuevo, como y, es 
un isomorfismo, la última igualdad implica que T = 0. 


La función O es suprayectiva, ya que si F € L(K”, K™), sea T :=YgoFodba: 
V — W, i.e., T está dada por el diagrama 


vas W 
sa| fe 
K” Tp RIA 
Entonces, 
O(T)=¢goT opa por definición de O 
= ġgo(ygoFoga)opa por definición de T 
= (¢g o YB) o F o (p4 0 Ya) 
=idoF oid 
=F. 


Denotaremos con Y : L(K”, K™) — L(V, W) a la inversa del isomorfismo O, es 
decir 


v(F):=YgoFoba 
es la función dada por el último diagrama. 
Resumiendo, hemos construido un isomorfismo de espacios vectoriales 
DW: L(K”,K") > L(V,W) 
y en la sección anterior obtuvimos otro isomorfismo 
9: Matmxn( K) > L(K”, K”). 
La composición de los dos isomorfismos anteriores: 
Yoğ: Matmxn( K) > L(K”, K™) = L(V, W) 


identifica transformaciones lineales T : V — W con matrices A de tamaño m x n. 
¿Cómo se calcula la matriz m x n asociada a una transformación lineal T : V — W? El 
procedimiento está implícito en los isomorfismos anteriores y lo detallamos a continuación: 


(1) Usando las bases A = {v1,..., Un} de V y B = {w1,..., Wm} de W, dado un vector 
v € V lo escribimos en la base A: 


V = 0101 +: H Ann E K” 
y así, la imagen de v bajo T es; 
T(v) = T(a101 +: + antn) = aT (01) +--+ anT(vn) EW 


por lo que, para obtener las coordenadas de T(v) € W en la base B, basta conocer las 
coordenadas de cada T (v;) € W en la base B. 
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El primer paso es entonces calcular las expresiones T(v;) en la base B: 


T(v1) = 01101 T 091W2 T *** + Am1Wmn 


T(vz) = 41201 + 4222 + © + am2Wm 


T(Un) = ainw + anw +-** + UmnUm 


así, ya tenemos las coordenadas de cada T'(v,) en la base B de W. 


(2) Usando lo anterior, podemos entonces calcular las coordenadas de T (v): 
T(v) = aT (01) + a2T (v2) +-::: +0. T (vn) 
= 01 (4111 + 091 Wa Ati am1Wm) 


-e 02 (41901 + 099W9 +: + am2Wm) 


+++ anldinw + 49702 + `+: + mn mn)» 
y así, las coordenadas de T'(v) en la base B de W son: 
[T(v)]s = [a1(a11w1 + 491W3 +:** + amıWm) 


+ Q9(0121 + 42202 +-::: + am2Wm) 


Aeon ae On (ainw + an wa +: + amnWm)|B 


a11 qa12  c** Qin Q1 
a21 Q22 02n Q2 
Am1 Am2 Ddi Amn Qn 


y por lo tanto, la matriz asociada a T en las bases A y B de V y W respectivamente, es la 
matriz 


Qil Q12 **:+ Qin 
Q21 Q22 ``’  Q%n 
Am1 Am2 a Amn 
a la que denotaremos mediante 
B 
[Ta 


Resumen. Dada una transformación lineal T : V — W, si A es una base de V y B es base 
de W, la matriz [T 15 asociada a la transformación lineal T’ se calcula como sigue: 


(1). Se calculan los valores de T en los vectores de la base A = {v1,. . . , Un } y se expresan 
en la base B = ([1w1,..., Wm} de W: 


T(v1) = 4111 + 421W3 + `- + amı Wm 


T(v2) = 41201 + 422 + `` © + A 20m 


T(v,) = dinw + 432 + :** + amnWm. 
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(2). La matriz [7]%, es la matrix cuyas columnas son las coordenadas [T(v;)]g que se 
calcularon en el paso (1). Dicho de otra manera, la matriz [75 es la transpuesta de la 


matriz de coeficientes del paso (1). 


Ejemplo 25. Rotaciones en R°. Si Ry : R? — R? es una rotación 
Ro(x, y) = (x cos 0 — ysen0, x sen 0 + y cos 0) 


si consideramos la base canónica A = {e1, e2} de R?, entonces 
1,€2 


Rele) = Re(1,0) =  (lcosð,1senð) =  cos0e¡+sen0 ez 


Roles) = Ro(0, 1) 


y así 


A_ (| cos —senó 
Rá (on cos O ) 


Ejemplo 26. Si T : R? — R? es la transformación lineal 


T(x,y,2) = (2x + y — 3z,x + z) 


(-1sen0+1cos0) = —sen0 e, + cosó ez, 


y consideramos las bases canónicas en ambos espacios A = [ E1, Ez, Ez) y B = {e1, e2}, 


para calcular la matriz asociada a T, procedemos como sigue; 


T(E) = T(1,0,0) = (21) = 2(1,0)+1(0,1) = 
T(E2) = T(0,1,0) = (1,0) = 1(1,0)+0(0,1) = 
T(E3) = T(0,0,1) = (23,1) = -3(1,0)+1(0,1) = 


por lo que 


2e1 e lez 
le; nl Des 
—-3e1 + lez, 


A = (1,1, 2?, £3} y en P2(R) consideramos la base B = (1, £, 2?), calculando 
D0) = 0 = 0:1+0:2+0-2? 
Da) = 1 = 1:14+0:2+0:2? 
Día?) = 2x = 0:14+2-2+0-2? 
D(z?) = 32? = 0:14+0-2+3-4*, 
por lo que 
0 100 
D5=|/002 0 
0.003 


Ejemplo 28. Si idv : V — V es la aplicación identidad y A = {v1,.. 


de V, entonces 
[idy]4 = In, 


., Un} es una base 
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donde /,, es la matriz identidad. En efecto, 


idy (v1) = V1 = 1-0 + Ova AO Y Ovn 


idy (v2) = v2 =00, +1- v2 +- + Ovn 


idy (Vun) = Vn = Ovi + 0v2 +--+ 1- vn. 


NOTA. En el ejemplo anterior se tenía A = B, es decir, las dos bases de V eran la misma; 
por eso se obtuvo la matriz identidad. Si las dos bases A Æ B son distintas, la matriz 
[id y] a resulta diferente de /,,, como veremos en la sección de cambio de bases. 


Composición de transformaciones lineales y multiplicación de matrices. Hasta ahora 
hemos visto que se tiene un isomorfismo de espacios vectoriales de dimensiones finitas 
TD: £(V,W) — Matmxn(V) 

que asocia a cada transformación lineal T : V > W la matriz [T]£, en las bases A de V 
y B de W. Como, T es lineal, satisface: 

O TT+D=TMD+T0). 

GD PAT) =AT(D), para A € K. 

Nuestro objetivo ahora es estudiar cómo se comporta I’ con respecto a la composición 

de aplicaciones lineales. Es decir, si U, V, W son tres K-espacios vectoriales de dimen- 
siones finitas con bases A, B, C respectivamente, y si L: U => V y T : V — W son 


aplicaciones lineales, entonces la composición T o L : U — W también es lineal y nos 
interesa saber cuál es la matriz que le corresponde en las bases respectivas: 


Teorema 2.28. Sean A, B, C bases de los K-espacios vectoriales de dimensiones finitas 
U, V,W.SiL:U — V yT : V — W son aplicaciones lineales, entonces 

[To LJ = [116 [JA 
Dicho en otras palabras: la composición de transformaciones lineales corresponde a la 


multiplicación de matrices. 


DEMOSTRACIÓN. Pongamos A = [L] y B = [T]. Dado cualquier vector u € U, sean 
[u] 4 sus coordenadas en la base A. Entonces, 
[L(u)]s = A: [ul a. 
Similarmente, para T(L(u)) € W, se tiene que 
[T(L(uw)le = B - [L(u)]g 
y así 
[I(T o Lu)le = B: [L(u)]s = B - (A; [u]a) = (BA): [u]a. 
Se sigue que 
[To 1%, = BA = TEA. 


EJERCICIO 44. Si f : R? — R? es la función dada por f(x,y) = (3x + y, 2x — y), 


(i) Muestre que f es un isomorfismo. 
Gi) Calcule su inversa f7!. 
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(iii) Encuentre la matriz asociada a f en la base canónica de R?. 
(iv) Encuentre la matriz asociada a $7! en la base canónica de Rĉ?. 


EJERCICIO 45. Encuentre la matriz asociada a las trasformaciones lineales T : R” — R” 
siguientes, donde en cada caso se tiene la base canónica correspondiente: 

© T : R4 — R? dada por T (x1, £2, £3, £4) := (11, 22). 

Gi) T : R? — R? dada por T (z1, £2, £3) := (£1, £2). 

(iii) T : R4 — R dada por T (x1, £2, £3, £4) := (z1, £2, 0, 0). 

(iv) T : R? — R? dada por T (£1, £2) := 3(z£1, £2). 

(v) T : R? — R? dada por T (x1, 12,13) := — (£1, £2, £3). 

(vi) T : R” — R” dada por T (T) := —7. 

(vi) T : R” — R” dada por T (T) := 57. 

(vi) T : R” — R” dada por T (T) := AT, con À € R fijo. 


EJERCICIO 46. Sea F : P¿(R) — Mat2x2(R) dada por 
aE] 


donde p' y p” denotan la primera y segunda derivada de p. Calcule la matriz asociada a F 
en las bases canónicas de los espacios vectoriales dados. 


EJERCICIO 47. Fije el polinomio g(x) = 3 + € Pa(R) y sea T : P,(R) — Pa(R) la 
función dada por T(f);= f'g+2f.Sea L: Pa(R) — R? la función L(a + bx + cx?) := 
(a +b,c,a — b). Sean A = [1, x, 1?) base de P2(R) y B = {e1, e2, e3} la base canónica 
de R3. 
(1) Demuestre que T y L son transformaciones lineales. 

(ii) Calcule [T] y [2]. 

(iii) Calcule Lo T : P¿(R) — R3. 

(iv) Calcule [L o 71%. 

(v) Compruebe que [L o 71% = [L]5 [T]4. 

(vi) Si f(x) = 3-22+2?, calcule |f] 4, [L(f)]8 y muestre que [L(f)]s = (14.4. 


EJERCICIO 48. Encuentre la matriz asociada a cada una de las rotaciones Rọ : R? — R? 
siguientes, en la base canónica de R?: 


© 0=1/2. 
GD 0 = 7/4. 
(iii) 0 =r. 
Gv) 0=-r. 
(v) 0 = —1/3. 
(vi) 0 = 1/6. 


(vii) 0 = 57/4. 


EJERCICIO 49. Considere la rotación R+/4 : R? — R?. 
(i) Calcule la imagen de 7 = (1,2) bajo la rotación R; /4. 
(ii) Calcule la imagen de 7 = (—1, 3) bajo la rotación Ry /4. 
(iii) Calcule la imagen de 7 = (—1,—1) bajo la rotación R.,/4. 


EJERCICIO 50. Si V y W son K-espacios vectoriales con bases A y B respectivamente, y 
T, F : V — W son aplicaciones lineales, 


2.5. CAMBIOS DE BASE 73 


(1) Demuestre que 
[T+ FIA = [714 + [FIA 
(11) Demuestre que 
DTIA =à- [TIA 
(ii) Si [77% = [F]§, ¿es T = F? 


EJERCICIO 51. Defina T : Mat2x2(R) — P2(R) mediante 


r( a 4) 00400740 


SODIO) 


B= {1,x, x°}. 


y sean 


G) Calcule |[T]§. 
Gi) Si F : Matəx2(R) — Mat2x2(R) está dada por F(A) = +A, calcule [F]4. 
Gii) Defina L : P> (R) — Mat2x2(R) mediante 


E TO 

wep a 
Calcule [L]f. 

(iv) Defina T : Mat2x2(R) — R mediante 


T(A) := Tr(4)), la traza de A. 


(a) Muestre que T es lineal. 
(b) Calcule [7]%,, donde C = {1} es base de R. 
(v) Defina G : P,(R) — R mediante G(f) = f(2). Calcule [G]£. 


(vi) sia=( a 


0 F , calcule sus coordenadas en la base A. 
(vi) Si f(x) = 3 — 6x + 27, calcule sus coordenadas en la base B. 


2.5. Cambios de base 


En la sección previa vimos que dado un espacio vectorial de dimensión finita V, es- 
coger una base de V equivale a establecer un isomorfismo p : V — K”, donde n = 
dimx(V). En esta sección consideramos la pregunta siguiente: ¿qué sucede si se eligen 
dos bases A y B de V, es decir, cómo son los isomorfismos anteriores, o cómo se relacio- 
nan? 

Supongamos entonces que A = [v1,...,Un) y B = [w1,...,w,y son dos bases del 
K-espacio vectorial V. Si v € V es cualquier vector, lo podemos expresar en términos de 
la base A como 

V = 01U1 + :** + QnUn 
de tal forma que sus coordenadas en la base A son 
(1) [v] a = [a1,..., an]. 
También lo podemos escribir en términos de la base $: 


v = bawi +:::+0b,Wn 
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de tal forma que sus coordenadas en la base B son 
(2) lug = [b1,...,dn]. 


Lo que buscamos es una relación entre las dos expresiones (1) y (2) anteriores para el 
vector v. Para esto, recordemos que las expresiones (1) y (2) en realidad son isomorfismos 


A y QB: 


V V 
sa| [os 
K” K” 
y como [v] 4 € K” lo queremos relacionar com [v]g € K”, lo que necesitamos es una 
función K” > K” que nos diga cómo obtener [v]g a partir de [v] 4. Ahora, como 


[v] a proviene del vector v € V y como [v]g proviene del mismo vector v € V, en el 
diagrama anterior es natural que pensemos en la función identidad idy : V —= V, para 
obtener el diagrama siguiente, donde hemos indicado con una flecha punteada a la función 
que necesitamos: 


idy 


V V 
sa| [os 
K” > K” 


y así, para idy : V — V, la correspondencia L(V, V) — L(K”, K”) nos provee de una 
(única) transformación lineal K” — K” que, como sabemos, corresponde a una matriz 
Q € Matnxn( K) que satisface 
Qlola = [v]8, 

es decir, es la función que cambia las coordenadas de v en la base A a la base B. Recorde- 
mos ahora que, como Q = ¿Hg o idy 044, entonces Q es un isomorfismo y así la matriz 
correspondiente es invertible. Denotaremos por Q = [idy]4 a esta matriz y la llamamos la 
matriz de cambio de base de A a B. 

Recordando cómo se obtiene, en general, la matriz asociada a una transformación li- 
neal, para el caso idy : V — V, se tiene que Q es la transpuesta de la matriz de coeficientes 
que se obtienen al expresar cada vector v; € A en términos de la base $. 


Ejemplo 29. En R? consideremos las bases A = {e1 = (1,0),€e2 = (0,1)) y B = [w1 = 
(1,1), w2 = (-1,1)). La matriz de cambio de base de A a B se obtiene expresando cada 
vector e; € A en términos de los vectores de la base $: 

(1, 0) = z(1,1)— 701,1) T 3] — jw 

(0,1) `. 3(1,1)+ ob) 7 31 + 342 


(41) 


es la matriz de cambio de base de A a B. 
Por ejemplo, si v = (3, —4) € R?, en la base canónica A sus coordenadas son [v] 4 = 
[3, —4] 4, y sus coordenadas en la base B son 


¡EEN 


y por lo tanto 


NINI = 


1 


lvls = Qlola = ( 2 


NINI = 


1 
2 
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es decir, [v]g = [-1/2,—7/2]g. 


Las propiedades siguientes son inmediatas: 


Lema 2.29. Sea V un K'-espacio vectorial de dimensión n y sean A, B,C bases ordenadas 
de V. Si Q es la matriz de cambio de base de A a B y si R es la matriz de cambio de base 
de B aC, entonces RQ es la matriz de cambio de base de A aC. 
DEMOSTRACIÓN. Por (2.22), la matriz asociada a la composición 
idy = idy oidy : V, A —> VB => V,C 
es 
[idy]á = [idv]álidv]A = RQ. 


Corolario 2.30. Sea V un K-espacio vectorial de dimensión n y sean A y B bases orde- 
nadas de V. Si Q es la matriz de cambio de base de A a B, entonces Q7! es la matriz de 
cambio de base de B a A. 


DEMOSTRACIÓN. Q = [idy]% es invertible ya que idy es un isomorfismo. Sea R = 
[idy]É la matriz de cambio de bases de B a A. En el lema anterior se tiene la situación 
idy = idy oidy : V, A > V,6B = V, A 
por lo que 
lidv]4 = [idv]$lidv]4 = RQ, 
y como lidy]4 = Í, por el ejemplo 28, entonces RQ = In. Similarmente se muestra que 
QR = h. Se sigue que R = Q7!, 


EJERCICIO 52. En el R-espacio vectorial R3, consideremos la base canónica A y sea 
B = [(1,0,0), (1,1,0), (1,1, 1)) otra base de R. 

(i) Encuentre la matriz de cambio de base de A a B. 

(ii) Dado el vector u = (3, 4,5) € R3, calcule [u] 4 y [u] s. 


EJERCICIO 53. Sea T € L(V, V) y sean A y B bases de V. Denotemos con [T] 4 = [7]4 
y con [T]g = [T]É a las matrices correspondientes a T en las bases A y B. Sea Q la matriz 
de cambio de base. Demuestre que 


[Fe = QT] aQ. 


EJERCICIO 54. Dadas dos matrices A, B € Matnxn( K), diremos que A es similar a B si 
existe una matriz invertible Q € Maty, xn (K) tal que 

B=Q” AQ. 
Así, el ejercicio anterior nos dice que la matriz A = [7] 1 es similar a B = [T]g. De- 
muestre que la relación de similaridad es una relación de equivalencia en Mat, xn (K). 


EJERCICIO 55. Sic: C — Ces la función conjugación c(a + bi) = a — bi, a,b € R, y 
consideramos a C como R-espacio vectorial con la base B = (1,1), 


(1) Muestre que c es lineal. 
Gi) Calcule [e]. 
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(iii) Considerando a C como C-espacio vectorial, muestre que la conjugación c no es 
lineal. 


Capítulo 3 


Sistemas de ecuaciones lineales 


OMENZAMOS EL ESTUDIO del álgebra lineal considerando la solubilidad de sistemas 
de ecuaciones lineales de la forma 


41171 + a122 + `+: + din Tp = b1 


09171 + 42222 +*** + 99 Un = ba 


Am1T1 + Am222 +: + UmnTn = bm 


con los coeficientes as; y términos indendientes b; elementos de un campo K dado, y en 
este capítulo culminamos, en la primera sección, con un criterio para la solubilidad de un 
tal sistema y un resultado que nos dice cómo es el conjunto de soluciones cuando éstas 
existen. Para ello usamos la herramienta desarrollada en los dos capítulos anteriores. En la 
segunda y tercera secciones desarrollamos un algoritmo, debido a Gauss, para verificar el 
criterio de solubilidad de la primera sección y al mismo tiempo determinar el conjunto de 
soluciones del sistema dado. 


3.1. Solubilidad de sistemas de ecuaciones lineales 


Para el sistema de ecuaciones lineales anterior, consideremos la matriz de coeficientes 
aij, a la que llamamos la matriz del sistema: 


011 012 Ain 

a21 Q22 02n 
A= , 

Am1 Am2 ARE Amn 


el vector columna de incógnitas y el vector columna de términos independientes: 


tı bı 
T2 Ee ba 

T= eK” y b= : Ee K”, 
Tn bm 


recordemos que, por definición de producto de matrices, el sistema anterior se puede escri- 
bir en forma abreviada como: 


(x) Ar=b 
y así, considerando la transformación lineal T4 : K” — K”™ asociada a la matriz A, el 
sistema anterior se escribe como 
Ta (z) = b, 
por lo que: 


TI 
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Lema 3.1. (1) En la situación anterior, el sistema AT = b tiene soluciones T E K” si y 
sólo si b € Im(Ta). 


(2) Si AT = 0 es el sistema homogéneo asociado, el conjunto de soluciones del sistema 
homogéneo es Sy, = ker(Ta). 


DEMOSTRACIÓN. Para (1) vea la página 85 y para (2) vea la página 84. 


La condición (1) del lema anterior nos dice que debemos conocer el subespacio vecto- 
rial Im(T4) para poder decidir si un sistema de ecuaciones AT = b tiene o no soluciones. 
La proposición siguiente nos dice quién es el subespacio Im(T4) y para esto, dada la matriz 
del sistema 


411 Q12 + Qin 
Q21 Q22 `° Q2 
A= , 
ami Am2 `: Amn 
pensemos en sus columnas 
015 
025 
Cj = A € K"; 
Amj 
de tal forma que la matriz A la podemos escribir como A = (C1, C2, .. ., Cn), donde las 


columnas C} son vectores de K”. 


Proposición 3.2. Sea A € Matinxn (1). Entonces, el subespacio Im(T4) C K™ está ge- 
nerado por las columnas C1, C2, ..., Cn, Le., 


Im(Ta) == K(C,, Ca, ...> Chn). 


Se sigue que la dimensión de Im(T4) es el número máximo de columnas de A linealmente 
independientes. 


DEMOSTRACIÓN. Si [e1,.., €n } es la base canónica de K”, por 2.11 la imagen de Ta : 
K” — K™ está generada por los vectores Ta(e;): 


Im(T4)= K(Tale1),..., Ta (en)). 


Ahora, como 


0 
Q11 012 Qin Qij 
a21 Q22 `°  02n g 02; 
Tales) = Aej = : 1 = : == Cj 
Ami Am2 *** Amn 0 Umj 


es decir, Ta (es) = C} es la columna j de A, el resultado se sigue. 


A la luz de esta proposición, la condición (1) del lema 3.1 se lee: 
El sistema A7 = b tiene soluciones & b € Im(T4) & b € K(C1,Ca,...,Cn) 
y observamos que esto último sucede si y sólo si 
K(C1,C2,..., Cn) = K(C1, C2,..., Cn, b) 
ya que K(C¡,C2,..., Cn) € K(C1, C2,- - -, Cn, 0). Hemos así probado: 
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Corolario 3.3. El sistema AT = b tiene soluciones si y sólo si 
dim kx K(Ci, Ca, ...> Cn) = dimg K(C;, Ca, ...> Chn, b). 


Observación. Si se tiene un sistema de m ecuaciones lineales con n incógnitas: 


01121 + 41232 ++: + GinTn = b1 


09171 + 499%2 + -** + 99 Tp = b2 


Am1T1 + Am27%2 + ` + QAmnTn = bm, 


la matriz del sistema es: 


a11 qa12 +t: Aln 

Q21 Q22 tt 02n 
A = 

Am1 Am2 Di Amn 


y si consideramos los términos independientes, tenemos otra matriz: 


a11 QIB ver Qin bi 
a21 022 02n ba 
Am1 Am2 Siia Amn bm 


a la que llamamos la matriz aumentada porque le agregamos una columna extra, la de 
términos independientes. Denotaremos esta matriz mediante (A|b), donde b denota la co- 
lumna de términos independientes del sistema. Con esta notación, el corolario anterior se 
lee: 


El sistema AF = b tiene soluciones < dim (Im Ta) = dim (Im Tam): 
En 83.2 desarrollaremos un algoritmo para calcular las dimensiones anteriores. 


El resultado siguiente reduce el problema de hallar todas las soluciones de un sistema 
AT = b al problema de hallar una solución particular del sistema más todas las soluciones 
del sistema homogéneo asociado AT = 0. 


Proposición 3.4. Si S C K” es el conjunto de soluciones del sistema de ecuaciones AT = 


b, bajo la condición (1) del lema anterior, y si vo E S es cualquier solución particular del 
sistema AT = b, entonces 


S = vo +ker(Ta) := {vo +w : w E€ ker(Ta)). 
DEMOSTRACIÓN. Si v € S, entonces Av = b, y como vo € S, entonces Avo = b. Se 
sigue que A(v — vo) = 0 y así v — vo € ker(Ta), es decir, v — vo = w € ker(Ta), i.e., 
v = vo + w E€ vo + ker(Ta) y por lo tanto S C vo + ker(Ta). 


Recíprocamente, si v € vo + ker(T4), entonces v = vo + w con w € ker(T4) y por 
lo tanto 


Av = T4 (v) = T4 (vo + w) = T4 (vo) + Ta (w) = Ta (vo) = Avo 


(ya que T4 (w) = 0 porque w € ker(T4)). Se sigue que Av = Avo = b, la última igualdad 
porque vo es solución del sistema. Se sigue que v es solución también, i.e., v € S. 
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3.2. Operaciones elementales y el rango de una matriz 


Si A es una matriz m xn con entradas en un campo K, considerando la transformación 
lineal asociada T4 : K” — K™, el objetivo de esta sección es desarrollar un método 
sencillo para calcular la dimensión de la imagen de T4. A esta dimensión se le llama 
el rango de la matriz A. Una aplicación inmediata del método que desarrollaremos, a la 
solución de sistemas de ecuaciones lineales, se hará en la sección siguiente. 

Para motivar las operaciones con matrices que necesitaremos, supongamos que A es 
la matriz de un sistema de ecuaciones AT = b: 


01121 + 41232 +++ + G1nTn = b1 


09171 + a222 + `` + M9 Tp = b2 


Am1T1 + Am2%2 + *** + QAmnTn = bm, 
y observemos que: 


(1). Si intercambiamos dos ecuaciones cualesquiera, el conjunto de soluciones no se altera. 


(2). Si fijamos cualquier ecuación 


(*) 0412] + Qi2£2 + *** + Qin Tp = bi 

y (a41,%,...,0n) € K” es una solución de (x), y si multiplicamos (*) por un escalar 
AF O: 

(t) (Aaii )£1 + (Aaiz)£2 + +++ + (Adin)Zn = àbi, 

entonces (&1, @2, . . . , Qn ) también es solución de (t). Recíprocamente, si (&1,. . . , @n) es 
solución de (f), factorizando y cancelando a A Æ O se sigue que (@1, @2,. . . , Œn) también 


es solución de (x). Por lo tanto, el conjunto de soluciones del sistema de ecuaciones AT = b 
no sea altera si multiplicamos cualquier ecuación del sistema por un escalar distinto de 
cero. 


(3). Si sumamos un múltiplo escalar de una ecuación a otra ecuación diferente, el conjunto 
de soluciones no se altera ya que, por ejemplo, si la primera ecuación del sistema la subs- 
tituimos por la ecuación que resulta de sumar la primera ecuación más A veces la segunda 
ecuación, el nuevo sistema es: 

(a11 + àa21)£1 + (a12 + Maz2)22 + >>> + (ain + Man) Zn = bı + Aba 


09171 + 02212 + ` -© + 029 Tn = b2 


Qm1T1 + Am 22 +*** + Aman Tn = bm, 


y si (&1,@2,...,Qn) E€ K” es una solución del sistema original, entonces también es 
solución del segundo sistema. En efecto,la única diferencia entre el sistema original y el 
nuevo es la primera ecuación, y para esta nueva ecuación, substituyendo (&1, @2,..., Qn) 
se tiene que: 
(a11 + AMaz1)a1 +-+: + (ain + Aan )an = (41101 +++ + ainan) 
+ Quar101 +. + A427 An) 
= bı + Ada. 


3.2. OPERACIONES ELEMENTALES Y EL RANGO DE UNA MATRIZ 81 


Recíprocamente, si (81, .. - , Bn) es solución del nuevo sistema de ecuaciones, enton- 
ces 


(a11 + àa21)b1 +-+: + (ain + Adan) ón = b1 + Aba 
az21b1 +`: + a2nbn = da 


de donde, restando A veces la segunda igualdad a la primera se obtiene que 


aiibi +:**+GinBn = b1 


i.e., (81,...,/ Bn) es solución de la primera ecuación del sistema original y por lo tanto es 
solución de todo el sistema original. 

Nótese que al asumir que operamos con la primera y segunda ecuaciones del sistema, 
no se perdió generalidad porque gracias a la parte (1) podemos intercambiar de lugar las 
ecuaciones del sistema. 


Consideremos ahora las operaciones (1), (2) y (3) que no cambian el conjunto de 
soluciones del sistema de ecuaciones lineales AZ = b y pensemos sólo en la matriz corres- 
pondiente: 


a11 ATZ AER Aln 

a21 Q22 ev? 02n 
A = 

Am1 Am2 E Amn 


Las operaciones correspondientes son: 
(1). Intercambiar dos renglones de la matriz. 
(2). Multiplicar un renglón de la matriz por un escalar A Æ 0. 


(3). Substituir un renglón por el renglón que resulta de sumar ese renglón y un múltiplo 
escalar de otro renglón. 


LLamaremos operaciones elementales con renglones a las operaciones anteriores. 
Más adelante veremos que se tienen las operaciones elementales con columnas corres- 
pondientes. 


Ejemplo 1. Dada la matriz 


1 2 0 
A= Za le 
-1 4 2 
si intercambiamos el segundo y tercer renglón se obtiene la matriz: 
1 2 0 
B=| -1 42 |, 
2 3 1 
y si multiplicamos el tercer renglón de A por —2 obtenemos 
1 2 0 
C=|2 3 1 ; 
2 -8 —4 
finalmente, si sumamos 2 veces el tercer renglón al segundo renglón de A se obtiene: 
1.2.0 
D= 0 11 5 


-1 4 2 
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Definición 3.5. Una matriz elemental m x m es una matriz que se obtiene al hacer una 
única operación elemental en la matriz identidad Im. 


Ejemplo 2. Si a la matriz identidad 


1 0 
L=| 0 0 
0 1 


O = © 


sumamos el segundo renglón al tercero, obtenemos la matriz elemental: 
1 0 0 
E=ļ|0 1 0 
0 1 1 
También, si multiplicamos el segundo renglón de /3 por 4 obtenemos la matriz elemental 


1 0 0 
E=| 040 
0 0 1 


El resultado siguiente nos dice que, dada una matriz A de tamaño m x n, hacer una 
operación elemental en los renglones de A es lo mismo que multiplicar A a la izquierda 
por la matriz elemental E que se obtiene haciendo la misma operación elemental en Im: 


Teorema 3.6. Sea A una matriz m x n con entradas en un campo K. Si la matriz B 
se obtiene de A por medio de una operación elemental en renglones y si E es la matriz 
elemental que se obtiene haciendo la misma operación elemental en Im, entonces 


B=EA. 


Recíprocamente, si E es una matriz elemental mx m, entonces la matriz producto EA 
es la matriz que se obtiene de A por medio de la misma operación elemental en renglones 
que se usó para obtener E a partir de Im. 


DEMOSTRACIÓN. Como hay tres tipos de operaciones elementales, debemos considerar 
estos tres casos: 


CASO 1. Supongamos que B se obtiene de A intercambiando los renglones p y q, con 
p AX q, y sea E la matriz elemental m x m que se obtuvo al intercambiar los renglones p y q 
en Im. Entonces, en el producto EA los únicos lugares afectados son aquellos en los cuales 
el primer índice es p ó q, es decir, los términos de la forma apj Ó aqj, para j =1,...,n; 
entonces, como en E estos renglones están intercambiados, en el producto EA el renglón p 
consiste de los términos (a41, 4g2,--- , gn) y el renglón q es (4,1, Ap2, - - - , @pn ), es decir, 
EA = B. El recíproco es similar. 


CASO 2. Si B se obtiene de A multiplicando el renglón i de A por el escalar A 4 0, sea 
E la matriz elemental que se obtiene de /,,, multiplicando su renglón ¿ por A. Entonces, el 
único renglón afectado de Im es el ¿-ésimo donde en el lugar (i, i) hay una A, y así 
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1 0 n 0 
0 1 0 0 
a11 a12 Ain 
EA 0421 022 02n 
a 0 0 A 0 0 
Am1 Am2 GEA Amn 
0 0 1 
011 012 Qin 
a21 022 02n 
= S = B 
AG;51 AG; sgt Allin ? 
Am1 Am2 E Amn 


ya que al multiplicar el renglón ¿ de E por la columna 1 de A, todos los términos se anulan 
excepto el término de A que está en renglón i, a saber, a; que queda multiplicado por A. 
Lo mismo sucede para las otras columnas de A. El recíproco es similar. 


CASO 3. Si B se obtiene de A sumando A veces el renglón q de A al renglón p, sea E la 
matriz elemental que se obtiene con la misma operación en Im. Entonces, el renglón p de 
E es de la forma 


(0,...,0,1,0,...,0,A,0,...,0) 
con un 1 en el lugar p y A en el lugar q; es decir, las entradas de E en el renglón p son 
1 sij=p 
ep =< à SIj=4 
0 en los otros casos 


y los otros renglones de E son los de Im sin cambio alguno. Es claro que el producto ÆA 
sólo afecta al renglón p de A, dejando los otros renglones de A fijos. Ahora, al multiplicar 
el renglón Æ, de E por la columna C} de A se obtiene 


Qij 
Q2j 
apj 
(0,...,0,1,0,...,0,A,0,...,0)- E = Apj + Ag 
Ag; 
Amj 
y así el renglón p de EA es 
(apı + Àq, Qp2 + AQg2, «+3 Apn + Aaqn) aan (apı, ...> apn) $ A(aq1, ...> aqn), 


es decir, es el renglón p de A más A veces el renglón q de A y por lo tanto EA = B. El 
recíproco es análogo. 
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Observación. Si A es mxn y E es una matriz elemental m x m, entonces al transponer, *4 
es n x m y *E es m x m. También, como al transponer los renglones se vuelven columnas, 
las operaciones elementales en renglones se vuelven operaciones elementales en columnas 
y así si la matriz B se obtiene de A por medio de la operación elemental en renglones que se 
usó para obtener E, entonces * B se obtiene de * A por medio de una operación elemental en 


las columnas correspondientes y * E se obtiene por medio de la misma operación elemental 
en *Im = Im. Se tiene así que EA = B implica que At E =*(EA) =*B. 


Corolario 3.7. Sea A € Matmxn( K) y supongamos que B se obtiene de A mediante 
operaciones elementales en columnas. Si E es la matriz elemental que se obtiene haciendo 
la misma operación elemental en columnas en I», entonces 


B= AE. 
Recíprocamente, si E es una matriz elemental mx m, entonces la matriz producto AE 


es la matriz que se obtiene de A por medio de la misma operación elemental en columnas 
que se usó para obtener E a partir de Im. 


DEMOSTRACIÓN. Sólo observamos que el producto es ahora por una matriz elemental a 
la derecha de A, porque al transponer se cambia el orden del producto. 


Proposición 3.8. Las matrices elementales son invertibles y la inversa de una matriz ele- 
mental es una matriz elemental del mismo tipo. 


DEMOSTRACIÓN. Como hay tres tipos de operaciones elementales, digamos en renglones, 
tenemos tres tipos de matrices elementales: 


CAso 1. Si la matriz elemental E se obtuvo intercambiando los renglones p y q de Im, con 
p # q, entonces al multiplicar Æ por otra matriz A de tamaño adecuado, se intercambian 
los renglones p y q de A. Así, para A = E, el producto EE intercambia los renglones p y 
q del factor E de la derecha, por lo que EE = Im y por lo tanto E = E”!, 


Caso 2. Si E se obtuvo de /,, multiplicando el renglón p de Im por A Æ 0, sea E” la 
matriz elemental que se obtiene de Jm, multiplicando su renglón p por A7*. Entonces E' es 
del mismo tipo que E y además es claro que EE' = Im = F' E y por lo tanto E7! = E”. 


CASO 3. Si E se obtuvo de Im sumando A veces el renglón q de Im al renglón p de Im, 
sea E” la matriz elemental que se obtiene de Im sumando —A veces el renglón q de Im al 
renglón p de Im. Es claro que EE’ = Im = E'E y por lo tanto ET! = E”. 


El rango de una matriz. Si A € Mat. xn(K), se define el rango de la matriz A como la 
dimensión de la imagen de T4 : K” — K”, es decir, 


rang(A) := dimx(ImTaA). 


Proposición 3.9. Sea T : V — W una transformación lineal entre espacios vectoriales 
de dimensiones finitas. Sean A y B bases de V y W respectivamente. Entonces, 


dimx (Im T) = rang (114) a 


DEMOSTRACIÓN. Consideremos el diagrama siguiente, para A = [T]§: 


V: W 


sa| [e 


Krog ee 
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donde las flechas verticales son los isomorfismos dados por las bases respectivas. Mostra- 
remos que ¿(Im T) = Im T4. En efecto, si w € ¢g(Im T), entonces w = ¿g(T (v)) con 
v € V. Se sigue que 


w=4%480T(w) = T4 0 pav) = Ta(ġa(v)) € Im(Ta) 
(la segunda igualdad es por la conmutatividad del diagrama anterior, es decir, para ir de V 
a K””, las dos rutas dan el mismo resultado). 
Recíprocamente, si w € Im(Ta), sea u € K” tal que T4(u) = w. Como ġ4 es un 
isomorfismo, para el u € K” sea v € V el único vector tal que H1(v) = u. Entonces, 
w==Ta(u) = Talb.a(v)) 
= Ta 0 alv) 
= ġgoT(v) por la conmutatividad del diagrama 
= ġg(T(v)) € ġg (mT) 
y así In T4 C ġg(ImT). Hemos así probado que ¿g(ImT”) = ImT4 y como ¢g es 


un isomorfismo, se sigue que las dimensiones de Im T e Im T4 son iguales, lo cual es la 
afirmación que queríamos probar. 


La proposición anterior reduce el problema de calcular la dimensión de la imagen de 
una transformación lineal arbitraria T : V — W al problema de determinar el rango de 
una matriz. Algunas veces, a la dimensión de la imagen de una transformación lineal T' 
se le suele llamar el rango de la transformación lineal T. Así, la proposición anterior nos 
dice que el rango de una transformación lineal T es el rango de la matriz asociada en 
cualesquiera dos bases de los espacios involucrados. 


La proposición siguiente nos dice que el rango de una matriz no cambia si la multipli- 

camos por matrices invertibles, a la izquierda o a la derecha: 
Proposición 3.10. Sea A € Matmxn(K). Si P es invertible m x m y Q es invertible 
n x n, entonces: 

(1) rang( AQ) = rang(A). 

(2) rang(PA) = rang(A). 

(3) rang( PAQ) = rang(A). 
DEMOSTRACIÓN. La parte (3) se sigue de (1) y (2). Para (1) observe que 

Im(Ta1q) = Im(Ta o) To) 


= T4 (To(K”)) 
= T4(K”) ya que To es un isomorfismo 
= Im(Ta). 


Se sigue que: rang( AQ) = dimx(Im(T1Q)) = dimx(Im(Ta)) = rang(A). 
Para (2), como Tpa = Tp o Ta, entonces 


Im(Tpa) = Im(Tp o T4) = Tp o TA(K”) = Tp(TA(K")), 
y como Tp es un isomorfismo porque P es invertible, entonces 
dimk(Tp(TA(K”))) = dimx(Ta(K”) 


y así 
rang(PA) = dimx(Im(TpA)) = dimx(Ta(K”)) = rang(A). 


86 3. SISTEMAS DE ECUACIONES LINEALES 
Corolario 3.11. Las operaciones elementales, en renglones o columnas, preservan el ran- 
go de una matriz. 


DEMOSTRACIÓN. Las operaciones elementales en una matriz A equivalen a multiplicar A 
por matrices elementales, que ya vimos que son invertibles. 


Si la matriz B se obtiene a partir de la matriz A mediante operaciones elementales, lo 
denotaremos mediante A ~ B y diremos que A y B son equivalentes. 


Teorema 3.12. Sea A € Matmxn(K) de rango r = dimx (Im Ta). Entonces, r < m, 
r < n y existe un número finito de operaciones elementales en renglones y columnas de A 


tales que 
I, 01 
(e) 


donde 01, 02 y 03 son matrices cero del tamaño adecuado. 


DEMOSTRACIÓN. Por la proposición 3.2, r es el número máximo de columnas lineal- 
mente independientes de A y por lo tanto r < n. Ahora, como Ta : K” = K™ y 
así Im T4 C K™, entonces r = dim x (Im T4) < m. Esto prueba la primera afirmación. 
Para la segunda afirmación, si A = 0 es la matriz cero, entonces r = 0 y por conven- 
ción ly = 0 y el número de operaciones elementales requiridas es cero. Supongamos que 
A # 0; entonces r > 0. Mostraremos que A se puede transformar en la forma requerida 
por inducción sobre el número de renglones m de A. 


(1) Si m = 1, entonces A = (a,,,412,...,41,) con algún aij A 0. Sea k el menor entero 
tal que a1 % 0. Entonces, A = (0,...,0,41x,...,41,) y multiplicando primero por a 
la columna k de A, y luego sumando múltiplos adecuados de esta columna a las columnas 
siguientes se sigue que 


A~ (0,...,0,1,0,...,0) ~ (1,0,...,0), 
donde la última operación elemental fue intercambiar la columna k con la primera. 


(ii) Supongamos que el teorema es cierto para toda matriz con < m — 1 renglones y sea 
A una matriz m x n. Como A Æ 0, existe un a; # 0 en el lugar (i, j). Intercambiando 
el renglón ¿ con el renglón 1 y la columna j con la columna 1, llevamos el término a; al 
lugar (1, 1); después multiplicamos por az" y ya tenemos un 1 en el lugar (1, 1). Sumando 
múltiplos adecuados de este 1 volvemos ceros todos los lugares a la derecha y abajo del 1 


y obtenemos una matriz de la forma: 


1 0 
(ir) 


donde 0 indica un renglón o columna de ceros y A’ es (m — 1) x (n — 1), y aplicamos 
inducción sobre A’. 


Corolario 3.13. Si A es m x n de rango r, entonces existen matrices invertibles B de 
tamaño m x m y C de tamaño n x n, tales que 


da 50 
TE 


DEMOSTRACIÓN. Usando el teorema anterior, ponemos B al producto de las matrices 
elementales en renglones y C el producto de las matrices elementales en columnas que se 
usaron para llevar A a la forma requerida. 
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Corolario 3.14. Si A es m x n, entonces 
rang(A) = rang(* A). 


02 03 
y por lo tanto rang(* A) = r = rang(A). 


DEMOSTRACIÓN. Por el corolario anterior BAC = ( a A ) y así 


0 
irtatm_ t( Ir 0 N_( L- 02 
coo (31) (% 2) 


Corolario 3.15. Si A es m x n, entonces 
rang(A) = número máximo de columnas linealmente independientes 


= número máximo de renglones linealmente independientes. 


DEMOSTRACIÓN. El rango de * A es el número máximo de columnas linealmente indepen- 
dientes de +A y las columnas de *A son los renglones de A. 


Corolario 3.16. Si A es m x n, entonces el subespacio generado por las columnas de A 
es isomorfo al subespacio generado por los renglones de A. 


DEMOSTRACIÓN. Por el corolario anterior tienen la misma dimensión. 


Corolario 3.17. Toda matriz invertible es producto de matrices elementales. 


DEMOSTRACIÓN. Si A es n x n invertible, entonces Ta : K” — K” es un isomorfismo y 
así Im T4 = K”, por lo que rang(A) = dimg (Im Ta) = n. Por el teorema 3.12 se sigue 
que A ~ In, es decir, existen matrices elementales E; y Fj, 1 <i <ky1< j< t, tales 
que 


(E1 Ep) A(Fi e Fe = h. 
Como cada matriz elemental es invertible y su inversa es otra matriz elemental, despejando 
A de la igualdad anterior se sigue el resultado deseado. 


1 2 3 0 
; ; 4 2 1 2 
Ejemplo 3. Calcule el rango de la matriz A = 5 0 1 2 . Para esto usamos 
2 4 6 0 
operaciones elementales: 
1 2 3 0 1 2 3 0 1 2 3 0 
11 1 
A= 4 2 1 2j |0 -6 -11 2] |0 1 -3 
5 0 -1 2 0 —10 -—16 2 0 10 16 -2 
2 4 6 0 0 0 0 0 0 0 0 0 
12 3 0 E O 1 0 -4 2 
11 1 11 1 11 1 
0 0 =3. 3 0.0. 1 —5 0.0. 1 5 
00 0 0 0 0 0 00 0 0 
1 0 0 a 1 0 0 0 
Ț7 1010 5 Ț71090100|/_/B 0 
0 0 1 -¿ 0010] 10.0 
000 0 0000 


y por lo tanto el rango de A es 3. 
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La inversa de una matriz. Usando el corolario 3.17 daremos un método para calcular la 
inversa de una matriz invertible A. Para esto necesitaremos los conceptos siguientes: si 
A = (aij) es una matriz m x n y B = (b;j) es una matriz m x t, denotaremos con (A|B) a 
la matriz m x (n +t) dada al yuxtaponer A y B una junta a la otra, es decir, (A| B) = (ci;) 
donde 
gak sil<j<n 
dd bi j-n sin+1<j3<n>+!t. 

Diremos que (A| B) es una matriz aumentada. Esto generaliza el caso cuando B = b es un 
vector columna m x 1, que ya habíamos encontrado antes. 


Lema 3.18. Si A = (aij) es una matriz mx n, B = (bij) es una matriz mx t y P = (piż) 
es una matriz r X m, entonces 
P(A|B) = (PA|P B). 
DEMOSTRACIÓN. Como (A|B) = cij donde 
AL Qij si 1 < J < n 
CiT I bijn Sin+1<< RP, 
si P(A|B) = (eij), entonces 


m T ; R 
ES _S Yra Pirro sil<j<n 
eij = 2 Pin) m i a Pikbk j-n sin+1<j<n+t, 


es decir, 
n2 término general de PA sil<j<n 
11 \ término general de PB sin+1<j<n+t, 
y por lo tanto P(A|B) = (PA|P B). 


Para aplicar este lema para encontrar la inversa de una matriz n x n invertible 4, 
consideremos la matriz aumentada 


(1) (AļIn) 


de tamaño n x 2n. Como A”! existe, multiplicando (1) por A7* y usando el lema anterior 
se obtiene: 


(2) AC (A|Tn) = (AAJA n) = (1n]47>). 

Ahora, como 47! es invertible, por el corolario 3.17, AT! es producto de matrices 
elementales, digamos 

A`! = Ep- Ei 
y así (2) queda: 
(Ex >: Er) (Alln) = (Ln 473), 

y como multiplicar por matrices elementales a la izquierda es lo mismo que hacer operacio- 
nes elementales en los renglones de (A]7,,), hemos probado la primera parte del resultado 
siguiente: 


Proposición 3.19. Si A es invertible n x n, su inversa A7* se puede hallar mediante un 
número finito de operaciones elementales en los renglones de la matriz aumentada (A| In) 
que transforman esta matriz en la matriz (1, 473). 

Recíprocamente, si mediante operaciones elementales en los renglones de (A|I,,) se 
obtiene la matriz (I„|B), entonces B = A7?, 
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DEMOSTRACIÓN. Sólo falta probar la segunda afirmación. Para esto, supongamos que 
Ey... ., Ey son matrices elementales que satisfacen que: 
(Er +- Es)(AlZ,) = (101). 


Entonces, B = (Ex +++ E1)In = (Ep --- E1) y (Ek --- E) A = Hn, y por lo tanto BA = 
I„. Se sigue que B = A”?, ya que en el producto de matrices, una inversa por un lado es 
inversa por los dos lados. 


1.23 
Ejemplo 4. Muestre que la matriz A = O 4 2 ]|esinvertible y calcule su inversa. 
-2 1 0 
1 2 3| 100 1 2 3|10 0 
(A|f3) = 0.4 2|010]>- 0 1 3 0 4 0 
—2 1 0/0 0 1 056/20 1 
1 2 3| 1 0 0 1 2 3 1 0 0 
p O e EEE E a a 
0,00. 311.200 L 0 0 1 a 
120|-¿2 E -£ 
e a 
a Ts zí 
1 0 0| -} 3 -4 
7 4 T p 
a EN ES e 7 zT = (131473), 
0 0 1| 3 -üi 7 
por lo que la inversa de A es: 
-1 3 4 
$o _1 
AT! = $ 3 il 
PE y 
7 14 7 


Sistemas de ecuaciones y el rango de una matriz. Si Az = b es un sistema de m 
ecuaciones en n variables, por el corolario 3.3 el sistema tiene soluciones si y sólo si 


dimx(C1,...,Cn) = dimx(C1,..., Cn, b), donde C; son las columnas de A. Hemos 
así probado: 


Corolario 3.20. Si AT = b es un sistema de m ecuaciones en n incógnitas, entonces el 
sistema tiene soluciones si y sólo si 


rang(A) = rang(A|b), 


donde ( A|b) es la matriz aumentada del sistema. 


Este corolario es importante porque el rango de cualquier matriz es relativamente fácil 
de calcular como veremos en la sección siguiente. Así, el criterio anterior es fácil de veri- 
ficar. Más aún, el método que desarrollaremos en la sección siguiente nos dará al mismo 
tiempo el conjunto de soluciones de un sistema soluble. 


EJERCICIO 1. SiT : V — W es una transformación lineal entre espacios vectoriales de 
dimensiones finitas, la nulidad de T es la dimensión del núcleo de T. La nulidad de una 
matriz A es la nulidad de la transformación lineal T4 asociada. Demuestre que la nulidad 
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de una transformación lineal es igual a la nulidad de la matriz asociada en cualesquiera 
bases del dominio y codominio. Sugerencia: en la notación de la proposición 3.9, muestre 
que ġa(ker T) = ker Ta. 


EJERCICIO 2. Sea A una matriz m x n. Demuestre que existe una sucesión finita de opera- 
ciones elementales de tipo 1 y 3 en renglones, que transforman A en una matriz triangular 
superior. 
EJERCICIO 3. Sean A y B matrices m x t y t x n, respectivamente. Demuestre que 
rang( AB) < rang(A), 
rang( AB) < rang(B). 


EJERCICIO 4. Sea A una matriz m x n. Demuestre que rang(A) = 0 si y sólo si A es la 
matriz cero. 


EJERCICIO 5. Sea A una matriz m x n con entradas en un campo K y sea À € K, A £ 0. 
Demuestre que rang(A A) = rang(A). 


EJERCICIO 6. Sean A y B matrices m x t y tx n, respectivamente. Suponga que rang(A) = 
m y rang( B) = t. Demuestre que AB es de rango m. 


EJERCICIO 7. Sea A una matriz m x n. Si A es de rango m, demuestre que existe una 
matriz B, n x m, tal que BA = Jn. 


EJERCICIO 8. Sea A una matriz m x n. Si A es de rango n, demuestre que existe una 
matriz B, n x m, tal que AB = Im. 


EJERCICIO 9. Calcule el rango de las matrices siguientes: 


3 2 5 2 4 6 -2 

0 -—1 4 1 -1 4 2 
an -3 4 0 na 3 3 10 0 

3 1 9 4 2 15 2 

I E R 1 2 3 4 

T 2 1 2 4 6 8 
E 1 0 1 US 1 2 3 4 

02 0 3 4 9 12 


EJERCICIO 10. Calcule el rango de las matrices cuadradas siguientes y determine cuáles 
son invertibles: 


20205 r 

a 6 5 5 1 

2 4 5 6 

223 zia 
C=|2 3 1|; D= 

1 o1) 1 2 2 |l 

3 4 —1 1 
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EJERCICIO 11. Encuentre la inversa de las matrices invertibles del ejercicio anterior. 


3.3. El método de Gauss 


Dado un sistema de m ecuaciones lineales en n incógnitas AT = b: 


01171 + 41232 +*** + GinTn = b1 


09171 + 42222 +:** + 499 Un = ba 


Am1T1 + A 2T2 + *** + AmnTn = bm 


el método que desarrollaremos transforma el sistema dado a un sistema que tenga el mismo 
conjunto de soluciones que el anterior, pero que luzca más sencillo—tan sencillo que sus 
soluciones sean casi inmediatas—digamos de la forma 


1 / 1 / 1 1 
21 + 01279 + a133 + A1414 + 07585 ++: + dinTn = b1 
1 1 1 1 y 
L2 + 49373 + A2414 + 095T5 + *** + 9, Un = bz 
1 1 1 =p 
T3 + Q344 + QA35T5 *** + ünn = b3 
1 A Dv 
Tr + Or ry1Pr+1 += m 


y la idea es trabajar con la matriz aumentada del sistema original (A|b) y transformarla, 
mediante operaciones elementales en renglones, en una matriz (4'|b') que tenga asociado 
el sistema de ecuaciones sencillo de arriba. Lo primero que debemos hacer es asegurarnos 
que el nuevo sistema tenga el mismo conjunto de soluciones que el sistema original: 


Proposición 3.21. Si AT = b es un sistema de m ecuaciones lineales en n incógnitas y 
si P es una matriz invertible m x m, entonces el sistema (PA) = Pb tiene el mismo 
conjunto de soluciones que el sistema original. 


DEMOSTRACIÓN. Sea S C K” el conjunto de soluciones del sistema original AT = b 
y sea S” C K” el conjunto de soluciones del sistema (PA)Z = Pb. Mostraremos que 
S = S”. En efecto, si v € S, entonces Av = b y así PAv = Pb por lo que v es solución 
del sistema (PA)z = Pb, i.e., v € S”. Recíprocamente, si v € S”, entonces (PA)v = Pb 
y multiplicando por la inversa de P obtenemos: P=+(PAv) = P7*Pb, i.e., Av = b y por 
lo tanto v € S. 


Corolario 3.22. Si AT = b es un sistema de m ecuaciones lineales en n incógnitas y 
si (A'|b') se obtiene de (Alb) mediante un número finito de operaciones elementales en 
renglones, entonces el sistema A'T = V' tiene el mismo conjunto de soluciones que el 
sistema original. 


DEMOSTRACIÓN. (4'[b') se obtiene de (A|b) mediante el producto de un número finito 
de matrices elementales E, ..., Ex. Poniendo P = E; - - - Ez, resulta que P es invertible 
y P(AIb) = (PA|Pb) = (A'|b'), por lo que A'Z = V es el sistema (PA) = Pb. 
Aplicamos entonces la proposición anterior. 


Ya que el corolario anterior garantiza que no cambiamos el conjunto de soluciones 
de AT = b, pensemos ahora cómo debe ser la matriz de un sistema de ecuaciones senci- 
llo como sugerimos antes. Un momento de reflexión, mirando al ejemplo sencillo previo, 
nos lleva a: (1) la matriz del sistema sencillo está escalonada y (11) los coeficientes de las 
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variables que encabezan las ecuaciones del sistema sencillo son igual a 1, por lo que des- 
pejar la variable correspondiente es trivial. Recordemos ahora, de la proposición 3.4, que 
el conjunto de soluciones de AT = bes de la forma 


S = vo + ker Ta, 


y por lo tanto el sistema sencillo debe serlo de tal manera que uno pueda leer el núcleo de 
Ta de este sistema, i.e., uno debería ser capaz de dar una base del núcleo ker T4 a partir del 
sistema sencillo. Esto nos lleva a pedir que en la matriz aumentada del sistema sencillo, las 
variables que encabezan ecuaciones sólo aparezcan en esa ecuación. La definición formal 
es como sigue: 


Definición 3.23. Una matriz m x n se dice que está en forma escalonada reducida si: 


(1) Todos los renglones con alguna entrada distinta de cero están arriba de los ren- 
glones que consisten de ceros. 
(11) La primera entrada distinta de cero de un renglón no cero es 1 y es la única 
entrada distinta de cero en su columna. 
(iii) El 1 de la primera entrada distinta de cero de un renglón no cero está en una 
columna a la derecha de la primera entrada no cero del renglón precedente. 


Observación. La condición (i) sólo dice que los renglones que consisten de ceros, si hay 
alguno de estos renglones, van en la parte de abajo de la matriz. La condición (iii) nos 
dice que la matriz está escalonada y la condición (ii) dice que un renglón no cero tiene 
un 1 como primera entrada no trivial y arriba y abajo de este uno sólo hay ceros. Así, la 
definición anterior captura lo que deseamos que quiera decir el término sencillo. 


Ejemplo 5. La matriz 


1 0 0 1 2 3 
0 1 0 2 3 1 
0 0 1 0 1 2 
000000 
está en forma escalonada reducida. 
La matriz 
1 0 2 12 3 
0 1 0 2 3 1 
0 0 1 0 1 2 
0 00000 


no está en forma escalonada reducida, ya que en la columna del 1 del tercer renglón no 
todos las entradas son cero. 


La matriz 
1 0 0 1 2 3 
0 3 0 2 3 1 
0 0 1 0 1 2 
000000 
no está en forma escalonada reducida, ya que el segundo renglón no comienza con un 1. 


La matriz 


E O E e 
Owenn 
OHNDNCO 
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no está en forma escalonada reducida, porque el 1 del tercer renglón no está a la derecha 
del 1 del renglón que lo precede. 


La matriz 


ooo. 
ooreo 
O ORN GO 
o.oo 
OHCOwN 
e OOO 


está en forma escalonada reducida. 


La cuestión siguiente es evidente: ¿ dada una matriz A de tamaño m x n, es posi- 
ble transformarla, mediante operaciones elementales, en forma escalonada reducida? La 
respuesta es afirmativa y el procedimiento para realizarlo es el método de eliminación 
gaussiana. 


Método de eliminación de Gauss. Dada una matriz A de tamaño m x n, si A es la matriz 
cero, por definición diremos que está en forma escalonada reducida. Supongamos entonces 
que A no es la matriz cero. El método que describiremos tiene dos partes: 


Parte 1. De arriba hacia abajo: 


PASO 1. Se escoge la columna distinta de cero más a la izquierda. Luego, usando operacio- 
nes elementales en renglones traslade una de las entradas distintas de cero en esta columna 
al primer renglón y luego conviértalo en 1 multiplicando este primer renglón por el inverso 
multiplicativo de la entrada Æ 0 en cuestión. Se usan en este paso a lo más 2 operaciones 
elementales. 


PASO 2. Usando a lo más m — 1 operaciones elementales de tipo 3 en renglones, convierta 
en ceros todos los lugares abajo del 1 del primer paso. 


PASO 3. Sin tomar en cuenta el primer renglón, considere las columnas de la matriz resul- 
tante y escoja la columna distinta de cero más a la izquierda. Repita los pasos 1 y 2 con 
esta columna. 


PASO 4. Sin tomar en cuenta los dos primeros renglones, considere las columnas de la 
matriz resultante y escoja la columna distinta de cero más a la izquierda. Repita los pasos 1 
y 2 con esta columna. Proceda de esta manera hasta que, sin tomar en cuenta los renglones 
donde ya se aplicaron los pasos 1 y 2, la matriz que resulte tenga sólo ceros o que ya se 
hayan agotado sus renglones. Note que el número de pasos es a lo más m. 


Parte 2. De abajo hacia arriba: 


PASO 1. Comenzando con el último renglón distinto de cero, usando operaciones elemen- 
tales de tipo 3 en renglones, convierta en ceros todos las entradas arriba del primer 1 de 
este renglón. De nuevo, el número de operaciones es a lo más m — 1. 


PASO 2. Repita lo anterior con el penúltimo renglón distinto de cero y proceda de esta ma- 
nera, de abajo hacia arriba, para convertir en ceros todos las entradas arriba de los primeros 
1 de los renglones distintos de cero. Note que en cada uno de estos pasos se usan sólo un 
número finito de operaciones elementales en renglones y el número de pasos es a lo más 
m. 


Observe ahora que con el método de eliminación gaussiana descrito arriba, a partir 
de la matriz A de tamaño m x n, se obtiene una matriz A” del mismo tamaño y que 
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tiene forma escalonada reducida ya que, por los pasos de arriba hacia abajo se satisfacen 
las condiciones (1) y (111) de la definición 3.23, y por los pasos de abajo hacia arriba se 
satisface la condición (11). Se tiene así: 


Proposición 3.24. El método de eliminación gaussiana transforma cualquier matriz A € 
Matmxn(K) en una matriz A” € Matmxn(K) en forma escalonada reducida. 


La primera consecuencia del método anterior es que el rango de la matriz A es igual 
al rango de A’ ya que A’ se obtuvo a partir de A mediante operaciones elementales, que 
no cambian el rango por 3.11, y se lee directamente de la matriz A’ escalonada reducida: 


Proposición 3.25. Sea A una matriz m x n y sea A' una matriz escalonada reducida 
que se obtiene a partir de A mediante operaciones elementales en renglones. Entonces, el 
rango de A es el número de renglones distintos de cero en A". 


DEMOSTRACIÓN. Sea r el número de renglones distintos de cero de A’. Observe ahora que 
como A’ está en forma escalonada reducida, los r renglones no cero de A’ son linealmente 
independientes ya que los 1 que están en la primera componente distinta de cero de cada 
uno de estos renglones están en diferentes columnas y son los únicos elementos distintos de 
cero en esas columnas. Así, cualquier combinación lineal de los renglones distintos de cero 
de A’ que dé el vector 0, debe tener todos los coeficientes igual a 0. Por lo tanto, el rango de 
A debe ser r. Finalmente, como A ~ 4”, entonces por 3.11, rang(A) = rang(A’) = r. 


2 3 13 3 17 

f ; eS 1 3 11 3 13 
Ejemplo 6. Calcularemos el rango de la matriz A = 2.4 16 6 2 usando 

1 2 8&8 2 10 


eliminación gaussiana. En efecto, usando operaciones elementales en renglones: 


2 3 13 3 17 1 2 8 2 10 

1 3 11 3 13 1 3 11 3 13 

2 4 16 6 24 || 24 16 6 24 

1 2 8 2 10 2 3 13 3 17 
1 2 8 2 10 
0 1 3 1 3 
“|o o 0 2 4 
G te= 
1 2 8 2 10 12806 
0131 3 01301 
STO: LA 4 |~]o0o0012 
0000 0 00000 
10204 10024 
01301 01031 
~“looo0o12/|~%|00102 
00000 00000 


y por lo tanto A ~ 4”, con A” escalonada reducida con 3 renglones no cero. Se sigue que 
rang(A) = 3. 


Unicidad de la forma escalonada reducida. Nuestro objetivo ahora es mostrar que si A es 
una matriz m x n y A! y A” son dos matrices en forma escalonada reducida equivalentes 
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a A, entonces A” = A”. Para esto, comencemos observando que si A es la matriz cero 
entonces A’ y A” también son cero porque son equivalentes a A. 

Supongamos entonces que el rango de A es r > 1. Nuestro primer objetivo es determi- 

nar algunas propiedades de cualquier matriz escalonada reducida equivalente a A, digamos 
A”: 
(1) Observe que, como A’ está en forma escalonada reducida y A” ~ A, por la proposición 
anterior el rango de A es el número de renglones distintos de cero de 4”. Observe también 
que en A’ hay r renglones cuya primera entrada no cero es 1 y que arriba y abajo (cuando 
es posible) de estos 1 sólo hay ceros. Por lo tanto, las r columnas correspondientes a estos 
1 son los vectores canónicos €14, . . . , €, de K™ ya que los m — r últimos renglones de A’ 
son todos cero. Entonces, r de las columnas C}, . .., C}, de A’ son los vectores canónicos 
e1,...,€y. Sean ki < ka < --- < k, los lugares donde están estos vectores canónicos, es 
decir, Ch, = e;. Sean Ck, las columnas correspondientes en A. 


(2) Mostraremos que Ck,- .., Ck, son linealmente independientes. En efecto, si se tiene 
una combinación lineal 


(a) Cr, +: +07Cr, =0, 


como A’ se obtiene de A mediante operaciones elementales en renglones, existe una matriz 
m x m invertible P tal que PA = 4”. Multiplicando (a) por P se obtiene 


(b) aPCx, +::+0pPCr, =0 
y como PCy, = Ch, = e;, entonces (b) es: 
aiei +: + arer =0 
y por lo tanto 1 = +++ = @r = 0 ya que los e; son linealmente independientes. Se sigue 
que Ck,- -, Ck, son columnas linealmente independientes de A. 


(3) Observemos ahora que como A’ tiene sólo r renglones no cero en la parte superior, 
cada columna de 4” es de la forma: 


/ 
Qij 


Se sigue que C; = aj jei +++: + ajer, y como C; = PC}, entonces 
Cj; = PC; = P (alje +e ay. ¡Cr) 

¡Pear t aP er 

= 01¿Ck, + + apjCOk, porque PCh, = ei. 


E 


Hemos así probado: 


Teorema 3.26. Sea A € Matimxn (A) una matriz de rango r > 1 y sea A' una matriz en 
forma escalonada reducida equivalente a A. Entonces, 


(1) Para cada i = 1,...,r existe una columna C, de A' tal que Cy, = e;, el vector 
canónico de K™ correspondiente. 
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(2) Si Ck; es la columna de A correspondiente al índice k;, entonces Cx,,...,Cx, son 
linealmente independientes. 


(3) Para cada j =1,...,n, si la columna j de A! es C; = 01501 ++*** + Qrjer, entonces 
la columna j de A es 


Cj = a1jCkı essa OrjCh,.. 


Corolario 3.27. Si A € Matinxn(A), entonces cualesquiera dos matrices en forma esca- 
lonada reducida equivalentes a A son iguales. Es decir, la forma escalonada reducida de 
A es única. 


DEMOSTRACIÓN. Sean A’ y A” dos matrices en forma escalonada reducida equivalentes 


a A con columnas (C1,...,C;,) y (CY, ..., Cn ) respectivamente. Mostraremos que C; = 
Ci para toda j. Para comenzar, podemos suponer que el rango r de A es r > 1. Por la parte 
(1) del teorema anterior las columnas e1, . . . , €, aparecen en A’ y A”. Sean kı < +++ < kr 


y la < ++» < Lr tales que C}, = e; y Cy, = ei. Mostraremos ahora que k; = £; para toda 
i = 1,...,r por inducción sobre r. 


(Sir = 1, Ch, = & = 074 y supongamos, sin perder generalidad, que 41 > kı. Si 
sucediera que 41 > kı, entonces Cy = (0 para 1 < j < 4, y por la parte (3) del teorema 
anterior la columna de A correspondiente a C; es Cj = 0 también, para 1 < j < 4. 
En particular, Ck, = 0, lo cual contradice la parte (2) del teorema (ya que Ck, debe ser 
miembro de un conjunto linealmente independiente). Se sigue que kı = 41. 


(11) Supongamos que k; = £; para toda ¿ < r. Mostraremos que k, = f£,. Sin perder 
generalidad, supongamos que £, > kp. Si sucediera que £+ > kr, entonces para 1 < 
j < lr, las columnas OH tendrían ceros hacia abajo comenzando con el renglón r — 1. 
Consecuentemente, por la parte (3) del teorema las columnas C'j correspondientes a c7 
tendrían también ceros hacia abajo comenzando con el renglón r — 1. En particular, Ck, 
tendría ceros a partir del renglón r — 1. 

Consideremos ahora la submatriz B de A dada por las primeras k, columnas: B = 
(C1,..., Ch, ) y observemos que los renglones de B, a partir del renglón r — 1 son todos 
cero y por lo tanto el rango de B es < r — 1, por (3.15). Pero esto contradice la parte (2) 
del teorema que afirma que Cj,,..., Ck, son linealmente independientes. 


Hemos así probado que los vectores canónicos e;,...,e, que aparecen en A’ y A”, 
están en las mismas columnas de estas dos matrices. Por lo tanto, las columnas de A que 
les corresponden son las mismas, es decir, Ck, = Ce, ,..., Cp, = Cen. 

Para mostrar que A’ = 4”, mostraremos que cualesquiera dos de sus columnas son 
iguales: C; = Ci. En efecto, escribiendo cada una de estas columnas como combinación 
lineal de e;,...,€e,.: 


C; = a1€1 +++ + rey y C} = biei +++ + brer, 
por la parte (3) del teorema anterior, la columna C; de A que les corresponde satisface que: 
C; = 01Ck, Ho. + 0r Cr, = P1Cr, Ho. + Brk, 


y, como los Ck, son linealmente independientes, entonces œ; = 5, para toda 1. Se sigue 
que C; = C} y por lo tanto 4' = A”. 
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Solución de sistemas de ecuaciones por el método de eliminación de Gauss. Si AT = b 
es un sistema de m ecuaciones lineales en n incógnitas y si (4'|b') es la matriz escalo- 
nada reducida equivalente a la matriz del sistema (A|b), por (3.21) y (3.22) el conjunto 
de soluciones de A'T = b’ es el mismo que el del sistema original. Consideremos el sis- 
tema A'T = b'. Entonces, si el sistema es soluble, el rango de A es igual al rango de 
(Alb) y así (4'|b”) tiene exactamente r renglones distintos de cero y por lo tanto el sistema 
A'T = b' tiene exactamente r ecuaciones lineales en n incógnitas y como A’ está escalo- 
nada reducida, cada una de las r ecuaciones del sistema A'T = b' está encabezada por una 
de r variables con coeficiente 1. 


PASO 1. Se separan las n variables x,,...,x, en dos conjuntos ajenos: 


(i) Las que encabezan una ecuación en A'T = b'. Hay r de estas variables. 
Gi) Las que no encabezan alguna ecuación de A'T = b'. Hay n — r de éstas. 


PASO 2. A cada variable que no encabeza una ecuación de A'T = b’ le asignamos un valor 
paramétrico tj. Así, hay n — r parámetros tj. 


PASO 3. Despejamos las r variables que encabezan ecuaciones en términos de los paráme- 
tros anteriores. 


Con los pasos anteriores se obtiene un vector v = (£1,..., £n) € K”, el cual es 
solución del sistema AT = b, como veremos a continuación, y donde sus componentes 
son de dos tipos: parámetros t; Ó sumas de (algunos) de estos parámetros más términos 
constantes. Para mostrar que v es solución del sistema AT = b, basta ver que es solución 
de A'T = b, donde A’ es la matriz escalonada reducida equivalente a A. Sin perder genera- 
lidad, podemos asumir de ahora en adelante que A = 4”. Escribamos A = (C1,..., Cn) 
con C} las columnas de A. Por 3.26(1) existen r índices 1 < kı < +- < kr < n ta- 
les que las columnas Ck; = e; (el vector canónico de K™ correpondiente). De hecho, 
los índices k; corresponden a las columnas de A donde aparecen los 1 que encabezan 
renglones. Sabemos, por 3.26, que las r columnas Ck, forman una base de Im T4. Deno- 
temos con C;, alas n — r columnas de A diferentes de las Cz,,, ordenadas por los índices 


1< ji < < Jn-r < n. Estas n — r columnas corresponden a las variables que no 
encabezan ecuaciones en el sistema Az = b. 
Ahora, dados n — r escalares t1, ...,tn—r (los valores paramétricos del paso 2 ante- 


rior), consideremos el vector columna 


¿=1 


Entonces, C es combinación lineal de (algunas) de las columnas de A y así C € Im T4. 
Ahora, como b € Im T4 porque estamos asumiendo que el sistema tiene soluciones, en- 
tonces b— C € Im T4, y como Cz, ,..., Ck, es base de Im T4, entonces existen escalares 
ÚNICOS Sp, ,--.,5x, tales que 


b- O = sk Cki +: +8k,Ch, 
y por lo tanto 


(x) b = (Sh Ch +00 E Sk, Ck) O S= YO Sri Cri + Y tiCj- 


¿=1 i=] 
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Se sigue que el vector 


T R= 
(ox) v= > Sk,Ck, + ) tiej 
i=1 i=1 


es una solución del sistema AT = b ya que 
r nr 
A-v= 5 Sk; Aek; + 5 t;Aej; 
i=1 i=1 
r nr 
= 5 Sh; Ch, + 5 t¿C;, porque Ae; = C} 
i=1 i=1 


=b por (x). 


Note que el vector v anterior es el vector v obtenido en los pasos (1), (2) y (3) de 
arriba. Observe también que, poniendo todos los t; = 0, se obtiene la solución particular: 
T 
VO := 5 Sk; Ck;- 
i=1 

Finalmente, en la solución (*x), poniendo t; = 1 y t; = 0 para las j Æ i, se obtienen 


las n — r soluciones 
T 


(1) u =D sC Ch, + es, 

i=1 
1 < i < n—r. Otra forma de describir el procedimiento anterior, para obtener los vectores 
ui, es el paso siguiente, que también comienza con la expresión obtenida para el vector v 
solución del sistema: 


PAso 4. Como en el vector v = (£1, . . . , £n) obtenido arriba, las componentes son sumas 
de (algunos) de los parámetros más términos constantes, podemos separar al vector v de la 
forma siguiente: 
(1) Agrupamos en un vector vo a los términos constantes de cada componente de v. 
(11) Juntamos en un vector los términos que contengan al parámetro t, de cada com- 
ponente de v. 
(111) Juntamos en un vector los términos que contengan al parámetro t2 de cada com- 
ponente de v. 
(iv) Etcétera. 
Después, del vector obtenido en (11) factorizamos a tı para obtener tiu; con uy un 
vector de K”. Similarmente, factorizamos a tə del vector obtenido en (ii) para tener tz2u2. 
Etcétera. Al final obtenemos la expresión siguiente para v: 


V = Vo + tiU + t2U2 +: + tn-rUn-r, 
con vo, U1,- - , Un—r Vectores de K”. 
Mostraremos ahora que los vectores u1, ... ,Un—r forman una base de ker T4, y para 
ésto comenzamos mostrando que generan este núcleo: en efecto, por construcción cada 


ui € ker T4 y así K(u1,...,Un-r) C ker T4. Supongamos ahora que u = (@1,..., 0) 
es cualquier elemento de ker T4. Entonces, el vector 


(1) u — 5 Ox UL = Y Ajek; 
j=1 


k=r+1 


3.3. EL MÉTODO DE GAUSS 99 


ya que, por la forma (f) de los u;, para k > r + 1, el vector —o.zuz contiene el sumando 
—QkEj, que cancela la componente o; en el lugar jẹ de u. 

Ahora, como ker T4 es espacio vectorial, se tiene que u — D 41 Zkuk E ker Ta y 
así el vector w := a Aep, E ker Ta. Es decir, A - w = 0, y como A - w es la suma de 


columnas de A con coeficientes las entradas A; correspondientes de w, entonces 
MCk, + +ArCx, =0 


y como los Ck, son linealmente independientes, entonces A; = 0 para toda ¿ y así en (t) 
se tiene que u — a aj uz = 0, es decir, 


n 
u= 5 akuk E Kluz,... ,Un—r) 


k=r+1 
y por lo tanto u1, ...,Un—r genera a ker T4 como se quería. 
Hemos mostrado así que Sp = ker T4 = K(u1,..., Un—r). Finalmente, como u1, .. ., 


Un—r generan ker T4, y como 
dimg ker Ta = dimx K” — dimx Im T4 = n — rang(A) = n — r, 
entonces U1, ...,Un—r debe ser una base de ker T4. Hemos probado así: 


Teorema 3.28. Sean AT = b un sistema soluble de m ecuaciones lineales en n incógnitas, 
(A'|b') la forma escalonada reducida de (A|b) y r el rango de A. Supongamos que vo y 
uz)... , Un—y se obtuvieron con el método descrito arriba. Entonces, 


(1) vo es una solución particular de AT = b. 
(2) u;,...,un—y es una base de ker Ta. 
(3) Consecuentemente, el conjunto de soluciones del sistema AT = b es: 


S = vo + ker T4 = {v E€ K” : v = vo + tiui + tous ++ tn-rUn-r, ti € K}. 


Ejemplo 7. Halle todas las soluciones del sistema 


311 +912+ 23 +5t4 = 7 


221 S 613 + 323 T T4 = 7 


zı +3Í23+ 3+2%4=3 


La matriz aumentada es: 


3 915]|7 
(Ab)=| 26 3 1|7 
1 311l3 


y usando el método de eliminación de Gauss: 
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391 5|7 1 3 1 1| 3 
2 63 1| 7ļ]~|3915]|7 
1 3 1 1| 3 2 63 17 
Ll 3 1 1 3 
=|00-2 2 | -2 

0 0 1 -—1| 1 

-32a A 1 3 

~| 00 1 -1| 1 
0-0. -=2. 2 2 

130 2 |2 

~| 0 0 1 -1j 1 

000 0fj0 


y por lo tanto rang(A|b) = 2 = rang(A), por lo que el sistema tiene soluciones. El sistema 
de ecuaciones equivalente al dado es: 
zı +33 +2r4=2 
£3 — z4 = 1 
y las variables que encabezan ecuaciones son xı y 23, y las variables que no encabezan 


ecuaciones son 12 y 24. Dando valores paramétricos a las variables que no encabezan 
ecuaciones: 


x2 =t1 y Za = t2, 
despejamos las variables que sí encabezan ecuaciones: 
Tg = 1 + T4 = + tə 
zı = 2 — 312 — 2T4 = 2 — 3tı — 2ta 
por lo que la solución general del sistema está dada por los vectores de la forma 
v= (Gra, T2, T3, 24) 
= (2 — 3tı — 2t2, t1, 1 + t2, t2) 
= (2,0,0,1) + (-3t1 — 2t2, t1, t2, t2) 
(2, 0, 0, 1) T tı(—3, 1, 0, 0) T tə(—2, 0, 1, 1), 


donde vo = (2,0,0,1) es una solución particular del sistema y u} = (—3,1,0,0) y 
uz = (-2,0,1,1) forman una base del subespacio de soluciones del sistema homogéneo 
asociado Sp. 


Ejemplo 8. Considere el sistema de ecuaciones: 


11 +21 + 4x3 + 5x4 = —4 


RiT 4x9 GIN 623 E 9x4 = —6 
2x1 + 613 + 10x3 + l4x4 = 6 


La matriz aumentada es: 


12 4 5| —4 
(Ap)=| 14 6 9| —6 
2 6 10 14| -6 
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y usando el método de eliminación de Gauss: 


1 2 4 5 —4 
1 4 6 9 —6 | ~ 
2 6 10 14| —6 


om. oome oone or 

=o ORO OrnN NNN 

=. oere N Omre NNA 

ve one ONU AAO 
A 


o 
(ss, 
O 
S 
= 


por lo que rang(A|b) = 3 4 2 = rang(A) y así el sistema no tiene soluciones. 


EJERCICIO 12. Si Aes m x nym < n, demuestre que el sistema AT = 0 tiene una 
solución no trivial. 


EJERCICIO 13. Si AT = b es un sistema de n ecuaciones con n incógnitas, demuestre 
que el sistema tiene una única solución si y sólo si A es invertible. Muestre además que la 
(única) solución es de la forma 7 = AT tb. 


EJERCICIO 14. Dé un ejemplo de un sistema de n ecuaciones con n incógnitas con más de 
una solución. 


EJERCICIO 15. Halle todas las soluciones del sistema de ecuaciones 


21+4Yy=2 = 5 
ry+z = 1 
+2y-2z = 4. 


EJERCICIO 16. Halle todas las soluciones del sistema de ecuaciones 
£1 + 212 — 823 =0 
2x1 —3x2+5%3 =0 
311 + 2% = 12x2 =0 


EJERCICIO 17. Halle todas las soluciones del sistema de ecuaciones 


311 =F lx, T— T3g = -2 
11 +52 — +223 =6 
221 + 322 + T3 =0 


EJERCICIO 18. Halle todas las soluciones del sistema de ecuaciones 
311 — 62 — T3 — T4 =0 
121 — 212 +5%3-—34 =0 
211 —4x2+313-4 =3 
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EJERCICIO 19. Halle todas las soluciones del sistema de ecuaciones 
4x1 + 312 — 923 + Za =] 
11 +2z£2 — 13x3 + 34 =3 
3x1 — L2 + 8%2 — 214 = -2 


Capítulo 4 


Determinantes 


ASTA AHORA HEMOS ESTUDIADO transformaciones lineales T : V — W entre K- 
H espacios vectoriales de dimensión finita, sin ninguna otra restricción. Para poder 
avanzar en el estudio de las transformaciones lineales, debemos considerar primero aque- 
llas funciones lineales que parezcan más sencillas, por ejemplo transformaciones lineales 
T : V — V de un espacio en sí mismo. Llamaremos operadores lineales a las funciones 
lineales de un espacio en sí mismo. Si V es de dimensión finita, digamos n, un operador 
lineal T : V — V corresponde a una matriz cuadrada A € Mata xn (1). Así, estudiar 
operadores lineales es equivalente a estudiar matrices cuadradas. Hay varios caminos para 
hacer ésto y en este libro seguiremos el enfoque clásico basado en las propiedades de los 
determinantes de matrices cuadradas. En este capítulo obtenemos las propiedades necesa- 
rias de los determinantes para que en los capítulos siguientes podamos continuar con el 
estudio de los operadores lineales. 


4.1. Expansión por menores 


Originalmente, los determinantes jugaban un papel importante en la solución algorít- 
mica de sistemas de ecuaciones lineales y, a pesar de que computacionalmente han sido 
relegados, conviene recordar este origen del concepto de determinante considerando un 
sistema de dos ecuaciones lineales en dos incógnitas: 


ax+by=e 


cz + dy = f 


del cual supondremos que tiene solución única, en particular, las matrices involucradas 
son de rango 2. Usando el método de eliminación, por ejemplo, multiplicando la primera 
ecuación por d y la segunda ecuación por b y luego restando obtenemos: 


adx + bdy = ed 
bcx + bdy = bf 


que restando nos da: 
(1) (ad — bc)xz = ed — bf. 


Similarmente, si multiplicamos por c la primera ecuación y por a la segunda ecuación y 
luego restamos para eliminar a la variable x, obtenemos: 


(2) (ad — bc)y = ec — af. 


El escalar ad — bc que aparece en (1) y (2) es # 0, como el lector puede comprobar 
fácilmente (vea el ejercicio 1), ya que el sistema original tiene una solución única. A este 
escalar se le llama el determinante de la matriz del sistema 


(ia) 
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y se denota 
det(A) = det ( , Y ) = ad — be. 


3 


Ejemplo 1. Si A = ( 9 


z entonces 
5 > 


det(A) = de ( 3 5 ]=30)-40)=15-8=7. 
2 


Ejemplo 2. Si A = ( 3 9 


) , entonces 


det(A) = det ( ls ) = 2(9) — 6(3) = 18 — 18 = 0. 


Supongamos ahora que se tiene una matriz cuadrada 3 x 3: 
011 42 013 
A= a21 Q22 023 
431 Q32 433 
y queremos definir su determinante. La idea es proceder recursivamente, aprovechando 
que ya sabemos calcular el determinante de una matriz 2 x 2. Para ésto, fijamos un renglón 
de A, digamos el primer renglón Rı = (a¡1,a12,413) y, para cada entrada aıj de este 
renglón, 1 < j < 3, se definen las matrices 2 x 2 que se obtienen al eliminar el renglón y 
la columna de la entrada a1;. Denotemos esta matriz por A1;. Hay tres de estas matrices: 


a22 023 a21 Q23 a21 Q22 
Aj = Ajo = A13 = E 
432 033 431 033 431 032 
Después, para cada entrada a1; consideremos el término (—1)!+/ a1; det(A1;), y lue- 


go los sumamos para definir: 
det(A) := (Dar det(411) + (—1)!+?a12 det(A412) + (—1)!ta13 det(Aı3) 


= 411 et( A11) — 012 det(Aı2) + 013 det(A413) 


4 5 1.5 1 4 
= 2000 ( SEIE SEIE a 


= 2(32 — 30) — 3(8 — 25) + 4(6 — 20) 
= 4+ 51 — 56 = —1. 
Recursivamente, supongamos que ya se definió el determinante de cualquier matriz 
cuadrada de tamaño menor que n x n y sea A = (aij) una matriz n x n. Para cada 


1 < i,j < n se definen las submatrices A;¿ de A, eliminando el renglón ¿ y la columna j 
de A: 


a 


4.1. EXPANSIÓN POR MENORES 105 


Columna C} 


| 


011 Q12 +++ Qij `> Qin 

Q21 Q22 *** Q2j `°  Q2n 

Renglón R; ——> Qil Qiz? cto Qij > Qin 

ai an2 >t anj ““* Ann 
Si ahora fijamos un renglón R; = (di1, Qi2,..., Qin) de A, y consideramos las n 
matrices A¿1, Ái2,..-, Ain, se define la expansión por menores del determinante de A a lo 


largo del renglón 1 como: 


det;(4) = ED" a det(A;1) + (Das det(A;2) +. + DP an det(Ajn) 
j=1 


Observemos, para comenzar, que esta definición de det;( A) depende, en principio del 
renglón R; que se usó para la expansión anterior. Probaremos más adelante, en 4.18, que 
en efecto no depende del renglón elegido para hacer la expansión. Ahora, como a la matriz 
A la podemos pensar en términos de sus columnas C}, digamos 


A = (C1, 0%: 0: Cn), 


podemos pensar al determinante de A como una función con n variables, a saber, las n 
columnas de A. Pensando al determinante así, lo primero que probaremos es que el deter- 
minante es una función lineal en cada una de sus variables: 


Proposición 4.1 (Propiedad 1). Sea A = (C1, ..., Cn) una matriz n x n con columnas 
Ci,..., Cn. Para cada uno de las columnas Ck, se tiene que: 


(1) Si la columna C; es la suma de dos otras columnas, digamos Cg = C, + C}, entonces 


det¿(C1, “e. -Cp +CX, e... Cn) =det;(C1, de PON .. ., Cp) +det; (C1, .. Ue .. ¿¿ En): 


(2) Si A € K y Cp es una columna de A, entonces 
det;(C1, ...) ACE, eeg Cn) = Adet;(C1, ..., Ck, ...) Cn). 


DEMOSTRACIÓN. (1): Como en A se tiene que la columna Cy = C;, + Cy, al considerar 
cada uno de los sumandos que aparecen en la definición de det; (A): 


(1) a; det(A;) 
podemos separarlos en dos casos con respecto al k fijo: 


CASO 1. Si j Æ k, entonces a;; no depende de C y, por hipótesis de inducción det; (A;;) 
es lineal en Ck. 
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Caso 2. Si j = k, entonces det;( Aix) no depende de Ck y dij = aik = aip + alh. Se 
tiene así que 
(Das det; (Aik) = (1): (al; + a!) det;( Aik) 
= DE det; (Aik) + Da, det;(A;x). 


Esto prueba (1). Para (2) el análisis es similar. 


Mostraremos más adelante que si dos columnas cualesquiera de una matriz cuadra- 
da son iguales, entonces su determinante es 0. Comenzamos con el caso cuando las dos 
columnas iguales son adyacentes: 


Proposición 4.2 (Propiedad 2). Si dos columnas adyacentes de una matriz A son iguales, 
entonces det;( A) = 0. 


DEMOSTRACIÓN. Supongamos que Ck = Cķ+ı para dos columnas de A. Como hemos 
fijado el renglón 2, debemos considerar qué es lo que pasa con los sumandos 


(DP aij det;(4;;) 
que aparecen en la definición de det,(4), variando el índice j de las columnas. 


Caso 1. Si j es diferente de k ó k + 1, entonces al eliminar la columna j y el renglón 
i de A, la matriz A;; sigue teniendo dos columnas adyacentes iguales y, por hipótesis de 
inducción, det;(A;;) = 0 y por lo tanto el sumando 


(—1) H aij det; (Aij) =0. 


CASO 2. Los dos sumandos restantes son: 
(x) (—1) aip det;(Aip) + (1) tta; p41 det (Aj. k41), 


donde las entradas aik = ai,k+1 porque Ck = Ck+1, y las matrices Aik = Ai k+1 porque 

en A al quitar la columna C% queda la columna Ck+ı que es igual a la que se quitó, y lo 

mismo sucede al quitar de A la columna Ck+1. Así, en (*) los dos sumandos son iguales y 

de signo opuesto y por lo tanto se cancelan. 
Se sigue que det;( A) = 0. 


Proposición 4.3 (Propiedad 3). Si I„ es la matriz identidad n x n, entonces det;(In) = 1. 


DEMOSTRACIÓN. En /,, cada aij = Osi i A j y ai = 1. Como cada Aj; = In—1 se sigue 
que 
n 


det,(4) = X` (—1)+ a,j det;(A;z) 


II 
pa 


Il 


(-1)% aj; deti(An) porque a;j = 0 para i Æ j 
(—1)”1 - det;(In—-1) = 1 por hipótesis de inducción. 


Proposición 4.4 (Propiedad 4). Si A es una matriz n x n, 1 < k < n y Ck y Cp, son 
dos columnas adyacentes, entonces al intercambiarlas el determinante cambia de signo. 
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DEMOSTRACIÓN. Sean 
A= (Oi O y lu Oi 
Mostraremos que det,(4) = — det;( A’). Para esto, consideremos la matriz auxiliar 
A” := (Ci, .-., Ck + Ck+1, Ck + Ch41) +++» Cr) 


donde en A substituimos la columna k por Ck + Ck+1 y lo mismo hicimos con la columna 
k + 1. Entonces, 
0 = det;( A”) por la propiedad 2 
=det;(C1,...,Cg,Cx,..., Cn) + det¡(C1,..., Ck, Cry1, +0, Cn) 
+ det¡(C1,...,Cry1, Ck, <- -, Cn) +det¡(C1,..., Ck+1, Ck+1;---,Cn) 
(por la propiedad 1) 
= det;( A) + det;(A’), 


la última igualdad, por la propiedad 2 aplicada al primero y cuarto sumandos. 


Proposición 4.5 (Propiedad 5). Si en una matriz cuadrada A dos columnas cualesquiera 
son iguales, entonces det;( A) = 0. 


DEMOSTRACIÓN. Se sigue de las propiedades 4 y 2. 


Proposición 4.6 (Propiedad 6). Si en una matriz cuadrada A una columna C; se substituye 
por la suma de un múltiplo escalar AC; de otra columna más la columna Cy, con j A k, 
entonces el determinante no cambia. 


DEMOSTRACIÓN. Sean 
A = (Chers Oprea y Or AC O Cl 
Mostraremos que det;(A) = det;( A’). En efecto, como j % k, entonces 
det;( A’) = det;(. ..) AC; + Ck, .. .) 
= det;(..., AC}, ...) + det;(...,Cp,...) por la propiedad 1 
= Adeti(...,Cj,...) + det;(...,Ck,...) por la propiedad 1 
= 0 + det;( A) (porque en la primera matriz hay dos columnas 


iguales, a saber C; en los lugares j y k) 


Proposición 4.7 (Propiedad 7). Si A = (C1,...,Cn) y las columnas son linealmente 
dependientes, entonces det;( A) = 0. 


DEMOSTRACIÓN. Por hipótesis algún C% es combinación lineal de los otros C}, j Æ k, 
digamos 


Cr = X AC}. 
jAk 
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Se sigue que 
det¿(4) = det¿(C1, ...3 Ck, e...) Cn) 


= det Cisose Y ACh,- Cn) 


jAh 
E 5y det;(C%, KOR , Cn) 
GA 
= 0, 


la última igualdad porque en las matrices involucradas las columnas de los lugares j y k 
son iguales, con j Æ k. 


Nuestro objetivo ahora será mostrar que el determinante no depende del renglón 2 que 
se usa para el desarrollo por menores. Suponiendo que ésto ya ha sido demostrado, pro- 
baremos la regla de Cramer de importancia teórica y que solía tener importancia práctica 
también para la solución de sistemas de ecuaciones lineales. Para facilidad de la notación, 
en lo que sigue denotaremos por det (A) a det, (A) (el determinante de A calculado por me- 
nores a lo largo del primer renglón de A). En 4.18 mostraremos que det,(4) = det (A), 
para todo 3. 


Teorema 4.8 (Regla de Cramer). Sea A = (C¡,...,Cn) € Matnxn( K) una matriz tal 
bı 

que det; A 4 0 y sea b = : |. Sean 21,..., £n números indeterminados y considere- 
bn 

mos el sistema de ecuaciones lineales 

(x) 12101 +-**+2/C, = b. 


Entonces, para cada j = 1,...,n, se tiene que 


AROS 
Tj det A j 


donde en la matriz del numerador b está en lugar de la columna Ci. 


DEMOSTRACIÓN. En el deteminante det(C,,...,b,...,C,,), substituyendo la columna b 
por el sistema de ecuaciones (x) en el lugar j, se obtiene 


A 
= NN 
det(C1,..., b y... Cp) = det (C1, ..., £101 +-+ £nCn,..., Cn) 


A~ 
= xı det(C1,..., (OE O a 


T Tj det(C1, e...) 
ma 
+ zn det(Ci,..., Cn ,..., Cn) 
= Tj det(C1, ...) Cn) 

= Tj det A, 
(porque sólo sobrevive el sumando donde en el lugar j está la columna C; y los otros 
sumandos son 0 ya que aparece una columna repetida). 
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4.2. Permutaciones y determinantes 


Sin > 1 es un entero, denotemos con I„ := (1,2,...,nj al subconjunto de los 
números naturales del 1 al n. Diremos que In es un intervalo de naturales. Una función 
biyectiva o : In — In se llamará una permutación de I„. Esta función la podemos repre- 
sentar mediante el arreglo: 


poza 1 2 3 ooe’ n 
NX o() 02) 0(3) = oln) 
donde debajo de cada natural x € I, hemos colocado su valor o imagen o(x) € Iņ. 


Ejemplo 4. Si n = 4, se tienen las permutaciones siguientes: 
(1234 (1234 
ETI e a E O E 


(1234 p= 1 2 3 4 
A SE E 
Note que una permutación a de I4 cambia de lugar los enteros 1,2,3,4. Es decir, en la 
notación de arriba, los enteros que aparecen en el renglón inferior son todos los números 


enteros del 1 al 4, y aparecen una sóla vez. Lo anterior es sólo una reformulación del hecho 
de que la permutación a es una función biyectiva, i.e., es inyectiva y suprayectiva. 


Denotemos con S,, al conjunto de todas las permutaciones de In. Si o, T € Sh, escri- 
biendo estas funciones con su dominio y codominio 


o: In — Ip y Talr >In 
es claro que las podemos componer para obtener la función: 
Toc: — L, 


dada por (T00)(x) := T(0(x)). Como 7 y ø son biyectivas, la composición 7 o ø también 
es biyectiva y así 
TOCTE Sn, 


es decir, la composición de funciones es una operación cerrada en Sn. Recordemos también 
que la composición de funciones es asociativa en general. También, si 


e =id,, : Ip > Ih 


es la función identidad dada por id,,(x) := x, para cualquier x € I,,, entonces id,, es una 
función biyectiva y por lo tanto idn € Sn. Observe ahora que, para cualquier permutación 
o € Sn, se tiene que idn or = o ya que 


(idn 00) (1) = idn (o(x)) = 0(x) 


y similarmente se muestra que g o idn = o. Finalmente, si o € Sn, como øg es biyectiva, 
entonces tiene una función inversa 07! : Ip — In dada por 


oy) == 0(2) =4y. 
La función 07? € Sn satisface que 
-1 


coo"! = idn y A 


es decir, 07? es la inversa de o en S„. Hemos así mostrado que: 
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Proposición 4.9. El conjunto S,, de funciones biyectivas de I,, en In es cerrado bajo la 
composición de funciones y satisface las propiedades: 

(1) e = id, € Sn. 

(2) Sio € Sn, entonces 07! € Sn. 


El conjunto S» junto con la composición, (Sn, o), se llama el grupo simétrico en n 
letras. Es conocido que hay n! funciones biyectivas de In» en In y así Sn es un conjunto 
finito de cardinalidad |S,,| = n! = 1 - 2 - 3 -- -n (el factorial de n). 

Ejemplo 5. Si n = 4, el grupo S4 tiene cardinalidad |S4| = 4! = 1 - 2 - 3 - 4 = 24. La com- 
posición de dos permutaciones en Sy es fácil, usando la notación introducida previamente, 
para T y Y como en el ejemplo 1. Por ejemplo, para las permutaciones 


[1234 gof i A 
PA a A E E 21)’ 
se tiene que 


laa 


e 123 4 

e 2.43 1) 
donde, en la segunda igualdad se calculó primero la acción de Y y luego la acción de 7; 
note que añadimos un renglón extra para hacer explícitos los cálculos, por ejemplo, como 


9(2) = 3, entonces T(Y(2)) = 7(3) = 4. La última igualdad elimina el renglón extra y 
escribe en la notación usual al resultado de componer las permutaciones Y y 7. 


Aa Ww 
N eA 
AA 
o) 
SS 
Aa =e 
w N 
N w 
= A 
REZA 
II 
N qa 
Aa WN 
w Nyo 
=.. A 


Observe también que es fácil ver la inversa de una permutación, por ejemplo, si 
1 2 3 4 
T = 
1 3 4 2 
la inversa se calcula leyendo el renglón inferior primero para que las imágenes sean los 
valores en el primer rengón, y así se obtiene: 


de /1234 
T SNL A2 3J 


Recordemos que la composición de funciones, en general, no es una operación con- 
mutativa. El ejemplo siguiente ilustra ésto: 


Ejemplo 6. Si n > 3, en el grupo Sn la operación composición en general no es conmuta- 
tiva. Por ejemplo, S3 es un grupo de orden 3! = 6 y sus elementos son: 


A 123 [123  /12 

t3 = UE 2 3J od ME E Z7\2 1 

a IL 
2 3 1 3 1 2 3 2 1 


y observe que 


A Ne de BN 
LA 12 ¡O a E O 
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A AE E VA 
cc MI: DI E e dE EE dl 


por lo que 0401 4 0104. Observe que este ejemplo sirve para cualquier n > 3 (ejercicio 
13). 


El signo de una permutación. Si a € S» es cualquier permutación e I, es la matriz 
identidad n x n, escribiendo a /,, en términos de sus columnas e; (que son los vectores 
básicos canónicos de K”): 

In =(€1,...,€n) 


y usando a ø podemos permutar las columnas de 1, definiendo 
La = (es(1)» od Estay) 


y observamos que como 1; sólo difiere de /,, en el orden en que aparecen sus columnas, 
entonces 


det(I7) = +det In = +1. 
Se define el signo de la permutación o como 


sgn(o) := det (17). 


Observe ahora que si A es cualquier matriz n x n tal que det A Æ 0, escribiendo A en 
términos de sus columnas A = (C4, ... , Cn) y definiendo (para o € Sn): 


A” := (Co)» la Cato) 
se tiene que: 
Lema 4.10. Si A es cualquier matriz n x n tal que det A 4 0 y si o € Sn es cualquier 


permutación, entonces 


sen(0) = det (47) / det(A). 


DEMOSTRACIÓN. Como A” y A sólo difieren en el orden en que aparecen sus columnas, 
entonces det A7 = + det A. Observemos ahora que 4” e IZ se obtienen a partir de A e 
In por medio de los mismos intercambios de columnas por lo que el cambio de signo en 
det A” es el mismo que en det IZ (que es sgn(c)), es decir, 


det A” = sgn(0) det A. 


Supongamos ahora que v,0 € S,, son dos permutaciones y consideremos su compo- 
sición o o 0 € S,, (es decir, primero se aplica 0 y luego se aplica o). Entonces, para hacer 
actuar la composición en las columnas de /,,, primero permutamos estas columnas usando 
0 y a la matriz I? le permutamos sus columnas usando ahora a ø, es decir, 


IR? = (IR) = (esa) >> +» 20(m))" = (es0(1),- >>> 200(m))- 
Se tiene entonces que: 
9) por definición de signo 


= det(1,,)? por la definición de la acción de una composición 


y hemos así probado 
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Lema 4.11. sgn(00) = sgn(o)sgn(0). 


Observemos ahora que, como g o aT! = idn, entonces 
1 = det(1,,) = sgn(idn) =sen(o)sgn(o”?) 
y por lo tanto: 


Corolario 4.12. sgn(o™!) = sgn(o). 


Permutaciones pares e impares. Una permutación o de S,, que intercambia dos elemen- 
tos de Iņ y deja fijos a los demás se llama una transposición. Si los elementos de Iņ, que se 
intercambian son a y b, entonces la permutación 7 : I,, — I,, correspondiente es la función 


x sirfa,b 
T(1)=Xb siz=a 


a six=b. 


Note la simplicidad de las transposiciónes, ya que sólo mueven dos elementos de Iņ. Si 
T es una transposición de S,, que intercambia a a con b, la denotaremos por T = (a,b). 
Observe que la inversa de una transposición 7 = (a, b), como permutación, es ella misma 
ya que 

TT(a)=T(b)=a y TT(b)=7(a) =b, 


y los otros elementos z € I,, están fijos bajo T y consecuentemente bajo 7? también. 
Hemos así mostrado que 7? fija a todos los elementos de I,, y por lo tanto 7? = id,,, i.e., 


T7| = T. ¿Cuál es el signo de una transposición? 


Proposición 4.13. Si 7 € Sn es una transposición, entonces sgn(T) = —1. 


DEMOSTRACIÓN. Supongamos que T € S,, intercambia a ¿ con j (para i % j) y deja 
fijos a los otros enteros de [1,...,n). Sin perder generalidad, supongamos que i < j y 
consideremos el determinante 


det(1)= det(e7(1); -< - tr) = det(..., ey us er e) 


Si movemos a e; (intercambiándolo con la columna que tenga a la derecha) hasta 
llevarlo al lugar adyacente a la izquierda de e;, esto involucra £ := j — i — 1 pasos. Des- 


pués, intercambiando a e; con e; (lo cual se hace en un sólo paso), nos queda la matriz 
i 
(os... €i, ej,» ..) por lo que para llevar a la columna e; al lugar ¿-ésimo que ocu- 


paba al principio e; se necesitan sólo £ = j — i — 1 pasos. En total se usan £ + 1 + £ pasos 
para poner a e; y ej en sus lugares correspondientes, de tal forma que 


sen(r) =det(17) =(-0) det(In) = —1. 


La importancia de las transposiciones radica en el resultado siguiente: 


Teorema 4.14. Toda permutación o en S,, es producto de transposiciones. 
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DEMOSTRACIÓN. Por inducción sobre n > 1. Si n = 1 no hay nada que probar. Sin > 1, 
sea O € S, y escribamos o (n) = k. Si k Æ n, sea T € Sn la transposición dada por 


i siiÆ k,n, 
T(i):= 4n sii=k 
k sii=n, 
(es decir, 7 intercambia k y n) y si k = n pongamos T = id,,. Entonces, la composición 


T o ø deja fija a n por la que la podemos ver como una permutación en Sp—1. Entonces, 
por hipótesis de inducción existen transposiciones T1, ...,Ts en Sk—ı tales que 


TO =T]0--:OT, 
y por lo tanto 


o=Trloro0=T lono OT =TOT]O::: OTs 


es decir, ø es producto de transposiciones como se quería. 

Corolario 4.15. Si o € S,, se expresa como producto de transposiciones 
T=T]_O0--**OTk, 

entonces sgn(o) = (-1)*, 


DEMOSTRACIÓN. Por 4.11 y 4.13, 


sen(o) = sgn(7, o --- o Tk) = sgn(71)---sen(r¿) = (1): (21) =( 13%: 


Así, para calcular el signo de una permutación, expresamos a la permutación como 
producto de transposiciones y luego contamos cuántas transposiciones hay. Si hay un 
número par, entonces el signo es +1 y si hay un número impar el signo es —1. Note 
sin embargo que la factorización del teorema anterior en general no es única. Por ejemplo, 


(1,2,3) = (1,3)(1,2) = (2,3)(1,3) = (1,3)(4,2)(1,2)(1, 4) 
= (1,3)(4,2)(1,2)(1, 4)(2, 3)(2,3). 


¿Qué es lo que no cambia en estas factorizaciones? El corolario anterior nos dice que lo 
que no cambia es la paridad del número de transposiciones involucradas (en el ejemplo 
anterior el número de transposiciones siempre es par). Una permutación d € S, se dice 
que es par si sgn(o) = 1 y se dice que es impar si sgen(o) = —1. El corolario anterior nos 
dice que una permutación es par si y sólo si en su factorización aparece un número par de 
permutaciones. 


El resultado principal de esta sección nos da una fórmula para el determinante de una 
matriz A = (aij) en términos de los coeficientes a;j, usando permutaciones de Sn, y que 
no depende de la expansión en menores a lo largo de un renglón de A. Antes necesitaremos 
un lema: 


Lema 4.16. Sean v;,...,v, vectores columna de K” y sea A = (aij) una matriz n X n. 
Pongamos 


C1 = 41101 +-** + QniUn 


Cn = 41nU1 +-+ + Annun.- 
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Entonces, 


det(Cy,..., Cn) = Y > sgn(0)a(1)1***Go(m)n det(v1, .-., Un). 
TESn 
DEMOSTRACIÓN. Para calcular el determinante de la matriz (C41, ..., Cn), substituimos 
las columnas C} por la combinación lineal correspondiente, usando la linealidad del deter- 
minante con respecto a cada columna y notando que si se repiten columnas el determinante 
correspondiente es 0 por lo que lss únicas combinaciones que sobreviven son aquellas cu- 
yas columnas son distintas, el determinante de la queda: 


det(C1,..., Cn) = det(a1101 +-+: + Qn1Un;--.-, 0101 +: + AnnUn) 


5 045(1),1*** Qo(n),n det(v¿(1), ia , Uo(n)) 
oESn 


5 Qo(1),1*** Qo(n),nSgn(o) det (vz, ..., Un), 
OESn 


la última igualdad por el lema 4.10. 


El resultado principal es: 


Teorema 4.17. Si A = (aij) € Matnxn( K), entonces 


det(A) == 5 sgn(0)a7(1),1 “+: 0Gó(n),n* 
0ESn 


DEMOSTRACIÓN. Si en el lema anterior ponemos v; = e; (los vectores columna canóni- 


cos), entonces para A = (C4, ..., Cn) se tiene que 
Cı = 41101 +: +anien primera columna de A 
Cn = 4ine1 +-+ annen n-ésima columna de A, 
por lo que 


det(A) = det(C1,...,Chn) 


= DD sgn(o)as(1),1'*' Qo(n),n det(e1,...,€n) por el lema anterior 
TESn 

= 5 sgn(o)ac(1),1***Qo(n)n ya que det(e1,..., €n) = 1. 
OESn 


Observe que la fórmula para det A del teorema anterior no depende del renglón en el 
que se desarrolle por menores el determinante de A. Hemos así probado: 


Corolario 4.18. Si A = (a;j) € Matnxn( K), entonces detı(A) = det;(A), para todo i. 


Una última observación: en la demostración de la fórmula para el determinante de A 
en el teorema 4.17 sólo usamos que det(1,,) = 1 y el lema 4.16, que a su vez sólo usó que 
el determinante es una función lineal en cada columna y se anula cuando dos columnas son 
iguales. Dicho en otras palabras: 
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Corolario 4.19. El determinante de una matriz A de tamaño n x n está unívocamente 
determinado por las propiedades: 
(1) El determinante es una función lineal de las columnas. 
(2) Si dos columnas de A son iguales, entonces det A = 0. 


(3) det(In) = 1. 


4.3. Propiedades de los determinantes 


Usando las siete propiedades de los determinantes y la fórmula de Cramer probadas 
en 84.1, y la fórmula para el determinante obtenida en $4.2, obtendremos en esta sección 
las propiedades de los determinantes que usaremos en los capítulos siguientes. El primer 
teorema que probaremos nos dice, en particular, que el desarrollo en menores para calcular 
un determinante puede hacerse también por columnas: 


Teorema 4.20. Si A = (aij) € Matnxn( K), entonces det(* A) = det(A). 

DEMOSTRACIÓN. Observe que, sio € Sn y o(j) = k, entonces 07+(k) = j y así 
Qo(j),k = Uk,o=1(k) 

y como [0(1),...,o(n)) = {1,...,n}, entonces cada producto 

(+) Qo(1),1 ` Qo(n)m = 01,9-1(1) *** On,o=1(n) 

y ya que sgn(o) = sgn(o?), se sigue que 


det(A) = 5 sgn(o)ao(1),1**'Qo(n)n pOor el teorema 4.17 


TESn 

T; 5 sgn(o™ t)ar ¿-1(1) “**Gno=i(n) POr (*) 
OESn 

= 5 sgn(o™t)ai 0-11) -++ An o—-1(n) 
oT1ESn 


(ya que 07? recorre Sp cuando ø lo hace) 
= det(* A). 


Teorema 4.21 (Determinante de un producto). Si A y B son matrices n x n, entonces 


det(AB) = det(A) det(B). 


DEMOSTRACIÓN. Si B = (b;;), pongamos A = (A1,..., An) con A; las columnas de A. 
Sea C = AB y pongamos Č = (C1,..., Cn) con C} las columnas de C. Entonces, para 


bii Spa bik gi bin 
(C1,..., Cn) = (A1, ..., An) : 
bni GaN bnk isk bnn 


por definición de producto se tiene que 


Ck = dix Ar +: t bnkAn 
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y así 
det( AB) = det(C¡,...,C;,) 
= det(b11 41 +. + 11 An, ...y din Ar +. + Ban An) 


= 5 sgn(o)bo(1),1 °t bofn),n det(A1,..., An) (por 4.16) 
oESn 


det(A) 5 sgn(o)bo(1),1 n bo(n),n 
oESn 
= det(A) det( B). 


Corolario 4.22 (Determinante de la inversa de una matriz). Si A € Matnxn( K) es inver- 
tible, entonces det( A7!) = (det A)7?. 


DEMOSTRACIÓN. AAT! = [,, y así 1 = det I„ = det(A) det(A7?). 


Teorema 4.23. Si A € Matnxn( K), entonces A es invertible si y sólo si det A 4 0. Más 
aún, si ej es el vector básico canónico visto como columna y si ponemos 

a det(C1,...,€j,..., Cp) 

4 det A 

donde la columna e; está substituyendo a la columna C; de A, entonces la inversa de A es 
la matriz 


b 


-1 
A” = (bi;). 
DEMOSTRACIÓN. Si A es invertible, entonces det A Æ 0 por el corolario anterior. Recípro- 


camente, si det A 4 0, pongamos X = (x;;) con las x;j indeterminadas y consideremos 
el sistema de ecuaciones 


(x) AX=h. 
Fijo el índice j, de la definición de producto de matrices y si A = (C1, . . . , Cn ), el sistema 
(+) nos da las igualdades 
x21jC1 +. + ZnjCn = €; 
que es un sistema de n ecuaciones en n incógnitas que se puede resolver usando la regla 
de Cramer, ya que det A 4 0, para obtener 
diet On) 
ÓN det A ? 
donde la columna e; aparece en el lugar de la columna ¿ de A. Así, con bij =: £ij se 
obtiene la matriz B = (bij) tal que AB = [,,. Nos falta probar que BA = In. Para ésto, 
observemos que como det(*4) Æ 0, aplicando el procedimiento anterior a la matriz * 4, 
existe una matriz C tal que *AC = I„. Se sigue que I„ = +I, =*(*AC) ='*CA y así 


In =*CA=*C(1,)A = 'C(AB)A = (CA)(BA) = 1,(BA) = BA. 


EJERCICIO 1. Una matriz cuadrada A se dice que es nilpotente si existe un entero k > 1 
tal que A” = 0. Si A es nilpotente demuestre que det(A) = 0. 


EJERCICIO 2. Una matriz A € Matnxn(C) se dice que es semisimétrica si *A = —A. Si 
A es semisimétrica y n es impar, demuestre que det(4) = 0. ¿Qué pasa si n es par? 
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EJERCICIO 3. Si A € Matnxn( K) y à € K, demuestre que det(A4) = A” det(A). 


EJERCICIO 4. Si A € Mat, xn(K) es triangular superior, i.e., si a;; = O para toda i > j, 
demuestre que det(A) = 411 :*: Ann. 


EJERCICIO 5. Sean Q11,...,Qn E K. Demuestre que 
la a o ay? 
-1 
l az af © 0 
det . = JI (aj = ai) 
: 1<i<j<nm 
1 an a © anm! 


donde a la derecha se tiene el producto de todos los términos (œj — œ;) con į < j enteros 
del 1 al n. Sugerencia: Use inducción y para esto multiplique cada columna por a y el 
resultado réstelo de la columna adyacente a la derecha. Demuestre que si V,, es el deter- 
minante de la matriz n x n de la izquierda y si Vp—ı es el determinante de una matriz 
(n — 1) x (n — 1) del mismo tipo, entonces 


Va = (an 3 01) ia (a = 01) Vn-1. 


EJERCICIO 6. Si M es una matriz cuadrada n x n de la forma M = n A con A 
k 


una matriz cuadrada (n — k) x (n — k), Ip la matriz identidad k x k, B cualquier matriz 
(del tamaño adecuado) y 0 una matriz cero adecuada, demuestre que det M = det A. 
Sugerencia: use inducción sobre k, el tamaño de la matriz identidad. 


EJERCICIO 7. Sea Sn el conjunto de permutaciones de {1,..., n}, para n > 2. Sea An C 
Sn el subconjunto de permutaciones pares y sea B,, C Sn el subconjunto de permutaciones 
impares. Sea 7 E Sn una transposición y considere al función fp, : An — Sn dada por 
p(0):=T00. 
(i) Sio € A, (i.e., es par), demuestre que T oø € Bn es impar. Se sigue que + 
induce una función Qd, : An > Bn. 
Gi) Demuestre que ġ+ : A, — Bn es biyectiva. 
Gii) Concluya que el número de permutaciones pares es igual al número de permuta- 
ciones impares. 


EJERCICIO 8. Sea A € Mat xn(K) tal que det A Æ 0 y sea b =*(b,,...,b,) un vector 
columna dado de K”. Sea X = *(%1,...,t,) un vector columna de incógnitas x; y 
considere el sistema de ecuaciones lineales AX = b. Demuestre que este sistema tiene 
solución única. 


EJERCICIO 9. Si A es una matriz invertible, en la fórmula para b;; del teorema 4.23 de- 
muestre que el numerador es (—1)*+1 det(A;;), donde Aj; es la matriz que se obtiene a 


partir de A eliminando el renglón j y la columna i. Concluya que 
1) 9 det (As; 
AT? = (bij) = transpuesta de EM) 


EJERCICIO 10. Si A es una matriz triangular superior invertible, demuestre que AT} tam- 
bién es triangular superior. 
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EJERCICIO 11. Sea A € Mata xn (K). Demuestre que A es invertible si y sólo si el rango 
de Aesn. 


EJERCICIO 12. Sea A € Mataxn(K). Una submatriz de A es una matriz que se obtiene 
eliminando (n — k) renglones y (n — k) columnas de A, para k entre 1 y n. Demuestre que 
el rango de la matriz A es el mayor entero r, entre 1 y n, tal existe una submatriz de A con 
determinante distinto de cero. 


EJERCICIO 13. Use el ejemplo 6 para mostrar que la operación composición no es conmu- 
tativa en S,,, para todo n > 3. 


Capítulo 5 


Diagonalización 


UANDO CONSIDERAMOS OPERADORES LINEALES en un K-espacio vectorial de di- 

mensión finita n, es natural hacerse la pregunta ¿cuáles serán los operadores lineales 

más sencillos? y una vez que tengamos una respuesta (o una idea para una respuesta), la 

pregunta siguiente sería ¿qué tanto se parece un operador lineal arbitrario a uno de los 
operadores lineales que consideramos sencillos? 


Homotecias. De todos los operadores lineales en un K-espacio vectorial, los más sencillos 
son de la forma siguiente: dado un escalar A € K, la función Fy : V — V dada por 
Fx(v) := Av claramente es una aplicación lineal a la que llamaremos una homotecia. 
Observe que si A = 1, Fy = idy y si A = 0, entonces Fo = 0 es la función constante cero. 
SiC = {v1,.. . , Un} es una base de V, la matriz asociada a F1 : V — V es de la forma 


(una matriz cuadrada n x n, con el escalar A repetido en la diagonal y ceros fuera de 
la diagonal principal). Estas matrices son fáciles de operar, por ejemplo, F1 : V = V 
es un isomorfismo si y sólo si la matriz [F1]g es invertible, lo cual sucede si y sólo si 
A” = det[F\]g 4 0, i.e., si y sólo si A Æ 0. También, la composición de dos homotecias 
es una homotecia ya que 


Fo o F3 = Fag 

y, si A Æ 0, la inversa de Fy es Fy-1. 
Matrices diagonales. Si A¡,..., A, son escalares, una matriz diagonal n x n es una matriz 
de la forma 

à 0 0 

0 à 0 

diag(A;) := 
O > 0 An 


con los escalares A; en la diagonal principal y ceros fuera de la diagonal. Así, las matrices 
asociadas a homotecias son diagonales. 

Si una matriz A no es diagonal, ¿cómo podemos diagonalizarla?, i.e., ¿cómo podemos 
transformarla en una matriz diagonal? 
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5.1. Valores y vectores propios 


Si A y B son dos matrices cuadradas n x n, decimos que A es similar a B si existe 
una matriz invertible Q tal que A = Q7*BA. Una matriz A se dice que es diagonalizable 
si A es similar a una matriz diagonal. 

Un operador lineal T : V — V en un K-espacio vectorial de dimensión finita n, se 
dice que es diagonalizable si existe una base B de V tal que la matriz asociada a T en la 
base B es diagonal. Si el espacio vectorial V tiene una base A y si T es diagonalizable, 
i.e., si existe otra base B tal que T es diagonal en la base B, sea Q la matriz de cambio de 
base, i.e., Q = lidy]§; entonces 


[T]s = Q[T]40 
y así las matrices [T]g y [T] 4 son similares. 


Teorema 5.1. Sea T : V — V un operador lineal en un K-espacio vectorial de dimensión 
finita n. Entonces, T es diagonalizable si y sólo si existe una base B =4W1,...,Un ) de V 
y escalares A¡,..., An (no necesariamente distintos), tales que 


T(v;) = jv; para todo j = 1,...,n 


y por lo tanto 


à 0 0 
0 à 0 
[Ty = i 
0 0 An 
DEMOSTRACIÓN. Si T es diagonalizable, existe una base B = (v1,..., vn) de V tal que 


[T]g = (dij) es una matriz diagonal, i.e., di; = A; y dij = 0 si i # j. Entonces, para cada 
vj € B se tiene que 


To; => 5 dijvi = djjvj = AjUj. 


i=1 
Recíprocamente, si Tv; = Ajvj para cada j, la matriz asociada a T es la matriz 
diagonal con los A; en la diagonal principal. 


Observe que en el teorema anterior cada vj es miembro de una base B y por lo tanto 
vj A 0; además el vector vj satisface que existe un escalar A; € K tal que Tv; = Ajuj. 
Esto motiva la definición siguiente: 


Definición 5.2. Sea T : V — V un operador lineal en un X-espacio vectorial V. Un 
vector v Æ 0 de V se dice que es un vector propio de T si existe un escalar A € K tal que 
Tv = Av. El escalar À se llama entonces un valor propio del operador T correspondiente 
al vector propio v Æ 0. Si A € Matnxn( K), un vector propio de A con valor propio A, es 
un vector propio del operador lineal T4 : K” — K” con valor propio A. 


Con esta terminología el teorema anterior se lee: 


Teorema 5.1*. Sea T : V — V un operador lineal en un K'-espacio vectorial de dimen- 
sión finita n. Entonces, T es diagonalizable si y sólo si existe una base B = [01,...,Un) 
de V consistente de vectores propios de T y si A¡,..., An son los valores propios corres- 
pondientes a los vectores vj, entonces |[T]g = diag(A;). 
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1 3 
4 2 


i 1 3 z 
a(i) 
(1). Si vı = (1, —1), entonces T4 (v1) = T4 (1, —1) = (-2,2) = —2(1, —1) = —201, por 
lo que v; es un valor propio de A y A1 = —2 es el valor propio correspondiente. 


(2). Si va = (3,4), entonces T4(v2) = Ta(3,4) = (15,20) = 5(3, 4) = 5v2, por lo que 
va es un valor propio de A y A2 = 5 es el valor propio correspondiente. 


Ejemplo 1. Sean V = R? y A = ( ) Para la transformación lineal asociada Ta : 


R? — R? dada por 


(3). Note que B = ([v,, vz) es una base de R? consistente de vectores propios y con valores 
propios A1 = —2 y A2 = 5. Del teorema anterior se sigue que 


ms = (7 A Je 


Como la matriz de cambio de base, de la base canónica A = {e1, e2} a B es 


1 3 
-1 4)” 
entonces Q7+ AQ = ( E . ) 


Ejemplo 2. Sea V el R-espacio vectorial de todas las funciones f : R — R que tienen 
derivadas de todos los órdenes y sea D : V — V la función dada por D(f) = f' (la 
derivada de f). De los cursos de Cálculo sabemos que D es un operador lineal y queremos 
determinar sus valores y vectores propios. Supongamos entonces que f € V es un vector 
propio de D con valor propio A € R. Entonces f' = Df = Af, es decir, tenemos la 
ecuación diferencial f’ = Af cuyas soluciones son de la forma f(t) = Ce**, para alguna 
constante C. Se sigue que todo real A es un valor propio de D y los vectores propios 
correspondientes son las funciones f(t) = C'e**, para C 4 0. Observe que para À = 0 los 
vectores propios correspondientes son las funciones constantes f(t) = C 4 0. 


En general, ¿cómo podemos calcular los valores propios de un operador lineal T' : 
V — V en un K-espacio vectorial de dimensión finita n? Para ésto, recordemos que para 
el operador T se tiene que dimx V = dim ker T + dim Im T y por lo tanto: 


(1) Si T : V — V es inyectivo entonces dimy = dimx Im T y por lo tanto T es supra- 
yectivo. 


(2) Recíprocamente, si T : V — V es suprayectivo, entonces dimx Im T = dimx V y 
así ker T = {0} y por lo tanto T es inyectivo. 


Es decir, 


(3) T : V — V es un isomorfismo + T es inyectiva > T' es suprayectiva. 
En particular, T : V — V no es un isomorfismo > ker T 4 {0}. 


Usando estas observaciones obtenemos un método para calcular los valores propios 
de T: 
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Teorema 5.3. Sea T : V — V un operador lineal en un K--espacio vectorial de dimensión 
finita n. Entonces, un escalar A € K es un valor propio de T si y sólo si el operador lineal 
(T — Midy) : V —> V no es un isomorfismo, i.e., si y sólo si det|[T — Aid,] = 0 (en 
cualquier base de V). 


DEMOSTRACIÓN. Si A es un valor propio de T, entonces existe un vector v Æ 0 en V tal 
que Tv = Av y así Tv — v = 0, i.e., (T — Aidy)v = 0 por lo que v € ker(T — Aidy) y 
por lo tanto ker(T — Aidy) 4 (0) y así (T — Aidy) no es inyectiva. 

Recíprocamente, si (T — Aidy,) no es invertible, entoces no es inyectiva, i.e., ker(T — 
Aidy) 4 {0} y por lo tanto existe v 4 0 en ker(T' — Aidy), i.e., v satisface que (T — 
Aidy)v = 0, i.e., Tv = Av. 


Corolario 5.4. Sea A € Matnxn( K). Entonces, un escalar A € K es un valor propio de 
A si y sólo si det(A — AL,,) = 0. 


DEMOSTRACIÓN. Directo de las definiciones y del teorema anterior. 


Definición 5.5. Si A es una matriz n x n con entradas en el campo K, el polinomio 
det(A — tIn) se llama el polinomio característico de A. Note que det(A — tIn) € Kft] es 
un polinomio, en la variable t, con coeficientes en el campo K. Denotemos este polinomio 
por ġa (t) y observe que su grado es n con coeficiente de grado el término (—1)”. 


Corolario 5.6. Sea A € Matnxn( K) y si pa (t) = det(A — tIn), entonces: 
(1) A € K es un valor propio de A si y sólo si A es raíz del polinomio característico 


ba(t). 


(2) La matriz A tiene a lo más n valores propios. 


DEMOSTRACIÓN. Directo de las definiciones y del corolario anterior. 


Ejemplo 3. Encuentre los vectores propios en R? de la matriz A = ( a q ) ; 


(1) El polinomio característico de A es: 


palt) = det(A — tI,) = det ( Pe a 


4 l-t 


cuyas raíces son À = 3 y A2 = —1 y así éstos son los valores propios de A. 


El 19?-4=4-2-3 


(2) Para el valor propio A¡ = 3, para hallar los vectores propios correspondientes conside- 
remos la matriz 


1-3 1 —2 1 
a AN 


Entonces, v = (x,y) € R? es un vector propio correspondiente al valor propio A; = 3 si 
y sólo si v 4 0 y v € ker(A — 312), i.e., si y sólo si v 4 0 y 


—2 1 zy /0 
4 -—2 y) 0) 
1.e., v debe ser una solución no trivial del sistema de ecuaciones 


—2r+y =0 
4r- 2y =0' 


Para resolver este sistema usamos el método de Gauss 


Mn a 
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4 -—2 

tiene rango 1); poniendo y = t obtenemos x — (1/2)t = 0 por lo que x = (1/2)t, y por lo 


tanto las soluciones del sistema anterior son los vectores de la forma 


v= (x,y) =((1/2)t,t) =t(1/2,1)=+(1,2) conteR. 


y así el espacio de soluciones, i.e., ker tiene dimensión 1 (ya que la matriz 


Así, los vectores propios de A con valor propio à; = 3 son los vectores de la forma 


v=t(1,2) cont €R \ (0). 


(3) Para el valor propio A2 = —1, consideremos la matriz 
E (1+1 1 E d 
A-xh=4+h=( 4 1+1 ) = ( 4 2 ) 
Entonces, v = (x,y) € R? es un vector propio correspondiente al valor propio A2 = —1 


si y sólo si v 4 0 y v € ker(A + 12), i.e., si y sólo si v 4 0 y 


2 1 DAS /0 
4 2 y) x0)” 
i.e., v debe ser una solución no trivial del sistema de ecuaciones 
2r+y =0 
dx+2y =0' 


Para resolver este sistema usamos el método de Gauss 
2 1 2 ral 1 1/2 
A+ :2 0 0 0 0 


y así el espacio de soluciones, i.e., ker tiene dimensión 1 (ya que la matriz tiene 


1 
4 2 
rango 1); poniendo y = r obtenemos x + (1/2)r = 0 por lo que z = —(1/2)r, y por lo 
tanto las soluciones del sistema anterior son los vectores de la forma 
v = (x,y) = (-(1/2)r,t) = r(-1/2,1) =r(1,-2) conreRkR. 
Así, los vectores propios de A con valor propio Az = —1 son los vectores de la forma 


v=r(1,-2) conre RAY (0). 


(4) Observe ahora que el conjunto B = {(1, 2), (1, —2)) es una base de R? consistente 
de vectores propios de A; por el teorema 1” se sigue que A es diagonalizable y la matriz 
diagonal similar a A tiene en su diagonal a los valores propios correspondientes, i.e., 


2100-33) 


Finalmente, viendo a la matriz A como una transformación lineal T4 : R? — R? 
considerando la base canónica A = ([e1,e2) de R?, al diagonalizar A usando la base 


B = [(1,2), (1, -2)), el cambio de base está dado por la matriz Q = ( ] $ ) 


124 5. DIAGONALIZACIÓN 


Supongamos ahora que se tiene un operador lineal T : V — V en un K-espacio 
vectorial de dimensión finita n. Si A y B son bases de V, sea Q la matriz de cambio de 
base y sea A € K. Entonces, 


[T — Midy]s = QT — Midy]4Q 
por lo que 
det[T — Aidy]g = det (Q[T — Aidy]4Q) = det(Q7*) det[T — Aidy] 4 det(Q) 
= det[T — Aidy] 1. 

Se sigue que el polinomio característico de la matriz asociada al operador T en cual- 
quier base de V no depende de esta base y por lo tanto tiene sentido hablar del polinomio 
característico del operador T. 

Observe también que si T : V — V es un operador lineal y v 4 0 es un vector 
propio de T y si A,A' € K son dos valores propios del vector propio v Æ 0, i.e., si 
Tv = Av = \'v, entonces (A — A)v = 0 con v Æ 0 y consecuentemente A — A = 0, i.e., 
A = A por lo que asociado al vector propio v hay un único valor propio A. 


Teorema 5.7. Sea T : V — V un operador lineal en un K-espacio vectorial V. Sea 
AE K y sea 


E, (T) := [todos los vectores propios de T con valor propio A} U {0}. 
Entonces, Ex (T) es un subespacio vectorial de V, y de hecho, 
EXT) = ker(T — Aidy). 
E, (T) se llama el subespacio propio de V correspondiente al valor propio A de T. 


DEMOSTRACIÓN. Por definición 0 € Ex(T) y si u,v € Ex(T), entonces Tu = Au y 
Tv = Av por lo que 


T(u +v) = Tu + Tv = àu + Av = Au + v) 


y consecuentemente u + v € Ex(T). Finalmente, si v € Ex(T) ya € K, entonces 
Tv = Av, por lo que 


T(av) = aTv = a(àv) = A(av) 


y así av € Ex(T). 


El teorema anterior nos dice, en particular, que si v1, V2 fueran dos vectores propios 
correspondientes al mismo valor propio A, entonces vı + vz también es un vector propio 
de T, correspondiente al valor propio A. Sin embargo, si vı fuera un vector propio corres- 
pondiente al valor propio A; y v2 fuera un vector propio correspondiente al valor propio 
A2 y si A1 Æ Az, entonces vı + va no es vector propio de T. Más aún, se tiene el resultado 
siguiente: 


Teorema 5.8. Sea T : V — V un operador lineal en un K'-espacio vectorial V. Sean 
U1,-+.,0, Vectores propios de T con valores propios A1, . . . , An, respectivamente. Supon- 
gamos además que Az,..., An son distintos. Entonces los vectores propios V1,...., Un SON 
linealmente independientes. 


DEMOSTRACIÓN. Por inducción sobre el número n de vectores propios considerados. Si 
n = 1, vı 4 0 es linealmente independiente. Supongamos válido el resultado para n — 1 y 
consideremos una combinación lineal 


(x) Q11 +:** F QAnUn = 0. 
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Mostraremos que todos los a; = 0. En efecto, multiplicando (*) por A, obtenemos 
(1) 01A1U1 =F 09A]U9 O y An A1Un =0 


y aplicando T a (x) obtenemos 


aıTv + a2Tvz +-::*+4n Tv, = Q, 


i.e., 
(2) a1 À1V1 + 494202 + +++ + Mn AnUn = 0. 
Restando (1) y (2) se obtiene 
(3) aslA2 — A1)ua +++ + an (Àn — A1)0n =0 
y como por hipótesis de inducción los n — 1 vectores propios va,...,U, son linealmente 
independientes, la igualdad (3) implica que 
(4) agl àz — A1) = =GnlAn — A1) =0 


y como Az — A1 40 para todo k > 2, entonces (4) implica que 


a2 =-"*:*=4n =Q 


lo cual substituido en (x) implica que avı = O con vı Æ 0 por lo que a; = O también. 


Corolario 5.9. Sea T : V — V un operador lineal en un K-espacio vectorial V de 
dimensión finita n. Si T tiene n valores propios distintos, entonces T es diagonalizable. 


DEMOSTRACIÓN. Por el teorema anterior T tiene n vectores propios linealmente indepen- 
dientes que por lo tanto forman una base de V y por el teorema 1” esto implica que T es 
diagonalizable. 


Observación. El corolario anterio nos da una condición suficiente para la diagonalizabi- 
lidad de un operador lineal T. Sin embargo la condición no es necesaria, por ejemplo si 
A = Ín es la matriz identidad n x n, entonces obviamente A es diagonalizable (de hecho, 
es diagonal) pero su único valor propio es À = 1. 


Corolario 5.10. Sea T : V — V un operador lineal en un K-espacio vectorial V de 
dimensión finita n. Si T es diagonalizable, entonces el polinomio característico dy (t) de 
T se descompone en factores lineales en K |t]. 


DEMOSTRACIÓN. Como T es diagonalizable, existe una base B de V tal que [T]g = 
diag(A1,..., An). Entonces, el polinomio característico 
Mt 0 ... 0 
0 Mt 0 . 
ọr(t) = det([T]g — tIn) = det s 
0 ka 0 Ant 
= (1-00 — t) On — t) = ED" A) (t— Az): c+ (t — An). 


Ejemplo 4. Sea Rọ : R? — R? el operador lineal que rota un vector v de R? un ángulo 6. 
En la base canónica de R? la matriz asociada a Rọ es 


[Ro] = ( cosg —senQ ) 


senó cos 
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y así, para v = (x, y) € R? se tiene que 
A cos —sen0 x Y _ ( xcos0—ysenó 
NIZA send  cosó y)  usend+ycosó j` 


(1) Supongamos ahora que 0 < 0 < m y observemos que si v Æ 0, entonces los vectores 
0,v, Re(v) no son colineales: 


Ro(v) 


y así, como los subespacios de dimensión 1 de R? son las rectas por el origen, entonces 
ninguno de estos espacios queda invariante bajo la acción de Ry. Esto implica que si 


W=([w: AER, v #0} 


es uno de estos subespacios de dimensión 1, entonces para cualquier w 4 0 en W se tiene 
que Re(w) £ W, i.e., Rg(w) Æ Av; en particular Ra(v) Æ Av (para v Æ 0). Se sigue que 
Ro no tiene vectores propios (y por lo tanto no tiene valores propios). Otra forma de ver lo 
anterior es considerando el polinomio característico de Rọ: 
cosó—t —sen0 

sen  cosg—t ) 


p(t) = det[Ro — tI2] = det ( 


= (cos 0 — t)? + sen? 0 = cos? O — 2t cos 0 + t? + sen? 0 
=P — (2cos0)t + 1, 
donde observamos que el discriminante del polinomio cuadrático anterior es 
A =b? — 4ac = 4cos? 0 — 4 


el cual es negativo ya que 0 < 0 < m implica que | cos 0| < 1 por lo que 4 cos? 0 — 4 < 0. 
Así, ọ(t) no tiene raíces reales, i.e., Rg no tiene valores propios reales y por lo tanto no es 
diagonalizable. 


Si T : V — V es un operador lineal en K-espacio vectorial de dimensión finita n, 
entonces su polinomio característico r(t) tiene grado n y así, contando sus multiplici- 
dades, r(t) tiene a lo más n-raíces y por lo tanto T tiene a lo más n valores propios. Si 
A € K es un valor propio de T con multiplicidad m > 1, los dos teoremas siguientes 
relacionan la dimensión del espacio propio correspondiente con la multiplicidad del valor 
propio y con la diagonalizabilidad del operador T. El lema siguiente generaliza el ejercicio 
6 del capítulo 4 y nos será útil tanto para el primer teorema que probaremos, como para la 
sección sobre espacios invariantes. 


Lema 5.11. Si M € Mataxn(K) es de la forma M = ( E) con A y C matri- 


0 C 
ces cuadradas, O una matriz cero y B una matriz, ambas de tamaño adecuado, entonces 


det M = det A det C. 


5.1. VALORES Y VECTORES PROPIOS 127 


DEMOSTRACIÓN. Por inducción sobre el tamaño k de la matriz C. Si k = 1, entonces 
A 


A= 0 7 , con B una matriz columna (n — 1) x 1. Desarrollando det M por menores 


a lo largo del último renglón queda 
det M = (-1)"*"c - det A = det C - det A 
ya que C = (c) por lo que det C = c, y al eliminar el último renglón se elimina la matriz 


renglón 0 (que es 1 x (n — 1)) y la matriz columna B (que es (n — 1) x 1). 
Supongamos ahora que el resultado es válido para matrices de la forma considerada 


y donde el tamaño de la matriz C es < k. Sea M = G o) con C una matriz k x 

k; entonces, desarrollando por menores a lo largo del último renglón que es de la forma 
n—k 

OS 

(0,...,0,Cx,1,-.-,Cx,), queda: 


(x) det M = EIA det M1 a EA det Mk,k 


donde My, ¿ es la matriz que se obtiene eliminando de M el renglón y columna correspon- 
dientes al término cy, j. Observemos que cada M, ¿ es una matriz de la forma 


u= (o 6) 
con C} una matriz (k — 1) x (k — 1). Aplicando la hipótesis de inducción se tiene que 
det My, į = det A det C} y substituyendo en (+) obtenemos que 
det M = (-1) ++ q, y det Adet Ci +- + (1) 94H cp p det A det Cy 
= det A [(-1) 4% cp, 1 det Ci +- + (1) *cp, 1, det Cp] 
= det A [(-1)%Hc;, 1 det Ci +++ +(-1)%*cp, 1 det Cy] 
(ya que —k + j = k + j (mód 2)) 
= det Adet C. 


Teorema 5.12. Sea T : V — V un operador lineal en K -espacio vectorial de dimensión 
finita n y sea A € K un valor propio de T con multiplicidad m > 1. Sea E, (T) el espacio 
propio correspondiente. Entonces, 


DEMOSTRACIÓN. Como Ex(T) C V, si {v1,..., Ur} es una base de Ex(T), podemos 
extender este conjunto a una base de V, digamos B = {v1,..., Ur, Ur+1;-.-, Un}. Sea 
A = |T]g y recordando que los v;, para 1 < i < r, son vectores propios de T con valor 
propio A, entonces la matriz A es de la forma 


A B 
a= (0 c) 


con C una matriz cuadrada (n — r) x (n — r). Se sigue que el polinomio característico de 
A es de la forma 


or (t) = det[A — tIn] = det (ES a e c EN = det - n E D 
= det[(A — t)1,] det[C — tIn-r] = (A - H" pc (t) 
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y por lo tanto (A — t)” divide a r(t) por lo que la multiplicidad m de A es al menos r, 
i.e., m > r = dimx(E,(T), como se quería. 


En general, puede tenerse la desigualdad estricta dim g E (T) < m, como lo muestra 
el ejemplo siguiente: 


Ejemplo 5. Sea T : C? — C? el operador lineal T'(w, z) = (z, 0). En la base canónica de 


C? la matriz asociada a T es [T] cuyo polinomio característico es py (t) = t? y 


TU o0 
así T tiene un único valor propio À = 0 con multiplicidad m = 2. Sin embargo, el espacio 
propio correspondiente Ey (T) = ker(T) = {(w,0) : w € C} tiene dimensión 1. 


El teorema siguiente nos dice lo que sucede cuando se tiene la igualdad 
dimx Ex(T) = multiplicidad de A, 
para todos los valores propios A de T. Antes, necesitaremos dos lemas. 


Lema 5.13. Sea T : V — V un operador lineal en K-espacio vectorial de dimensión 
finita n. Sean A¡,..., Ax todos los valores propios distintos de T. Para cada i = 1,...,k 
sea vi € Ex,(T). Si vi +--+- + = 0, entonces vi = 0 para toda i. 


DEMOSTRACIÓN. Si sucediera lo contrario, renumerando los vectores si hiciera falta po- 
demos suponer que 01,...,Us son 4 0 y 0541 =+: = Vk = 0. Entonces, para 1 < i < s 
los v; son vectores propios de T con valores propios A;, respectivamente, y se tiene que 
vı +--+ Vs = 0, en contradicción con el teorema 5.8. 


Lema 5.14. Sea T : V — V un operador lineal en K-espacio vectorial de dimensión 
finita n. Sean Aj,..., Ax todos los valores propios distintos de T. Para cada i = 1,...,k 
sea B; un subconjunto linealmente independiente de E, (T). Entonces, B = B1 U- - -U Bk 
es un subconjunto linealmente independiente de V. 


DEMOSTRACIÓN. Pongamos BB, = LU; 1,- - - , Vin; }, de tal forma que 
Si se tuviera una combinación lineal 


k ni 
(x) D> QijUij = 0, 


i=1 j=1 


Ni 
para cada ¿ pongamos w; = 5 Qijtg € Ex, (T); entonces la combinación lineal (x) la 
j=1 


k 
podemos escribir como 5 wi = 0, con los w; € Ea,(T'). Por el lema anterior se debe 
¿=1 
tener que w; = 0, para todo i, y como los BB, son linealmente independientes, de la igualdad 
ni 
0=w, = 5 QijVij se sigue que a;j = 0, para todo j y todo 1, como se quería. 
j=1 


Teorema 5.15. Sea T : V — V un operador lineal en K -espacio vectorial de dimensión 
finita n. Supongamos que el polinomio característico py de T se descompone en factores 
lineales en K|t] y sean A,,..., Ax todos los valores propios distintos de T. Entonces, T es 
diagonalizable si y sólo si dimx Ex,(T) = multiplicidad de A;, para todo i. 
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DEMOSTRACIÓN. Pongamos m; = la multiplicidad de A; y d; = dimx Ea, (T). Observe 
que n = dimx V = gr(97) = X; mi. 

Si T es diagonalizable, entonces existe una base B de V consistente de vectores 
propios de T. Sean B; = BN Ex,(T) y ni = |Bil; entonces, cada B; es linealmen- 
te independiente y por lo tanto n; < dimx E,,(T) = di. Ahora, por el teorema 5.11, 
dimx Ex, (T) < m; y así ni < di < m;. Se sigue que 


T T T 

a A A 
n=) m<? d<% m=n 

¿2=1 ¿=1 2=1 


por lo que todas necesariamente d; = my, para toda 1. 

Supongamos ahora que d; = m; para toda i. Sea B; una base de E,,(T') y sea B = 
Bı U -++ U Br. Por el lema 5.13 B es linealmente independiente y como d; = m; y ya que 
Bi N B; = Í, para i 4 j, entonces 


|B| => 1B,] => d= mi =n 
i=l i=1 ¿=1 


por lo que B es una base de V y como está formada por vectores propios de T, se sigue 
que T es diagonalizable. 


5.2. Subespacios invariantes y subespacios cíclicos 


Si T : V — V es un operador lineal y v € V es un vector propio de T, el subespacio 
generado por v, W = (vw) = K(v) satisface que T(W) C W. En efecto, si w = av € W, 
entonces Tw = aTv = aùv = (aA)u € W (donde A es el valor propio de v). 


Definición 5.16. Si T : V — V es un operador lineal, diremos que un subespacio W C V 
es invariante bajo T o que es T-invariante, si T(W) C W, i.e., si Tw € W para todo 
weW. 


Ejemplo 6. Sea T : V — V cualquier operador lineal. El subespacio {0} € V es T- 
invariante claramente. Lo mismo para el subespacio total V C V. El núcleo ker T' C V 
también es T-invariante ya que T(ker T) = {0} C V. También, la imagen ImT C V es 
T-invariante ya que si w € Im T C V entonces Tw € Im”. 


Ejemplo 7. La observación del inicio de esta sección es cierta en general: si T : V = V 
es cualquier operador lineal y A es un valor propio de T, el espacio propio Ex(T') es T- 
invariante ya que si w € Ex(T), entonces w = ) a;v; con a; € K y los v; € V vectores 
propios de T correspondientes al valor propio A. Se tiene entonces que 


Tw = 5 ajTv; = Xo ail àvi) = DD aivi = Aw 
por lo que Tw es un vector propio de T (si es # 0) con valor propio A, i.e., Tw € EX(T). 
Ejemplo 8. Sea T : R? — R? el operador dado por T (a, b, c) = (a+b, b+c, 0) y sea W el 


plano XY, i.e., W = {(x,y,0) € R}. Entonces W es T-invariante. Lo mismo es cierto 
si tomamos para el subespacio dado por el eje X. 


Una familia importante de subespacios T-invariantes es la de los subespacios T'-cícli- 
cos: 
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Definición 5.17. Sea T : V — V un operador lineal y sea v € V cualquier vector no nulo 
de V. Sea W el subespacio generado por los vectores v, Tv, T?v, T*v,... Claramente W 
es T-invariante y se llama el subespacio T'-cíclico generado por v. 


Observación. El subespacio T'-cíclico generado por v es el menor subespacio T'-invariante 
que contiene a v. En efecto, si W” C V es cualquier subespacio T'-invariante que contiene 
a v, entonces Tv € W’ y así T?v € W”, etcétera. Así, todos los generadores de W están 
en W” y por lo tanto W’ C W. 


Ejemplo 9. Sea T : R? — R? el operador dado por T(a,b,c) = (—b + c,a + c,3c) y 
sea e, = (1,0,0) € R. Queremos determinar el subespacio T-cíclico generado por e1. 
Para esto observamos que Te, = T(1,0,0) = (0,1,0) = e2 y Te, = T(0,1,0) = 
(-1,0,0) = —e; por lo que 
T*e, 5 (E 
tea 


y así W = R(e,,Te,,T?e,,...) = R(e1, e2) es el plano XY. 


Observación. Si T : V — V es un operador lineal y W C V es T-invariante, entonces la 
restricción de T a W es un operador lineal 


y como tal hereda algunas de las propiedades de T: 
Teorema 5.18. Sea T : V — V un operador lineal en un K-espacio vectorial de dimen- 


sión finita n y sea W C V un subespacio T-invariante. Entonces, el polinomio carac- 
terístico prTy, de la restricción de T a W divide al polinomio característico pr de T. 


DEMOSTRACIÓN. Escojamos una base B = ([1w1,...,w,) de W y extendámosla a una 
base de T, digamos C =([W1,...,W, Uy+1)+- +. , Un P. Entonces, 


[Te = (Prl E) 


donde [Tw]g es r x r, B es r x (n—r), C es (n — r) x (n — r) y 0 es una matriz cero de 
tamaño adecuado. Entonces, 


prio = ae (Crati > 
= det([Tw]g E tidy) det(C = tidy) 
= Pr (1)h(t), (donde h(t) = det(C — tidy)), 


i.e., rw (t)lór(t). 


Teorema 5.19. Sea T : V — V un operador lineal en un K-espacio vectorial de dimen- 
sión finita n y sea W el subespacio T-cíclico generado por un vector v + O en V. Sea 
r = dimx W. Entonces, Lv, Tv,T?v,...,T""%v) es base de W. 


DEMOSTRACIÓN. Como v Æ 0, entonces {v} es linealmente independiente. Sea k > 1 
el mayor entero tal que B = [v,Tv,T?v,...,T'*=lv) es linealmente independiente. Tal 
k existe porque V es de dimensión finita. Sea U C W el subespacio generado por B, de 
tal forma que B es base de U porque es linealmente independiente y genera. Observe que 
T*v € U ya que v,Tv,T?v,..., T*=w,T*v es linealmente dependiente, por la maxima- 
lidad de k, y por lo tanto T*v es necesariamente combinación lineal de los otros vectores, 
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y por lo tanto T*v € U. Se sigue que U es T-invariante ya que si u € U es cualquier 
vector, escribiéndolo en términos de la base $, 


u=buthTuto $b Pt 
se tiene que Tu = byTv +b,¡T%v+---+by-¡T*v € U. Ahora, como W es el menor 


subespacio T-invariante de V tal que v € W y como v € U y U es T-invariante, se sigue 
que W C U y por lo tanto W = U, como se quería. 


Observación. ¿Si W = K(v,Tv,T?v,...,T*=1y) es el subespacio T-cíclico anterior, 
cómo es la matriz asociada al operador Tw : W — W en la base v, Tv, T?v,..., T*=14? 
Calculando, 
Tw (vu) = Tv = 00+1Tv+0T%w+---+0T*-ly 
Tw(Tv) = T?w = 00+0Tv+1T?%w+-+--+0T*-ly 
Tw(T?™v) = T3v = 00+0Tv+0T?%0+1T%w+-+--+0T*-1y 
Tw(T*2y) = T*érly = Ov+0Tv+0T?v +. +17% 
PEA = Tw = aov — a1Tv — aoT°?v — - - - = ap- T47 tw 
por lo que 
0 0 0  —ay 
1 0 0 —aı 
[Twls = 0 1 O  —az 
0 0 +++» 1 —ax-1 


y así también podemos calcular su polinomio característico: 


Teorema 5.20. Sea T : V — V un operador lineal en un K-espacio vectorial de dimen- 
sión finita n. Sean W C V el subespacio T'-cíclico generado por un v +£ 0, k = dimg W 
y B=(1fv,Tv,..., T"=lp) la base anterior de W. Entonces, el polinomio característico 
de Tw es 


PTw (t) = (—1)" (ao +at +: + apt! de EF). 


DEMOSTRACIÓN. Lo demostraremos por inducción sobre k. Para k = 1 es trivial. Ahora, 
por definición 


—t 0 0 —00 
1 —t 0 01 
1 0 —092 
Prw (t) = det([Twls — tIk) = det 
0 0 > —t —0k-2 
Do o E aean) 


y expandiendo por menores a lo largo del primer rengón obtenemos 
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—t 0 0 01 
1 =t 0 —092 
PT (t) = (=t) det 
0 0 =t —0k-2 
0 0 1 (=t-ax-1) 
1 —t 0 0 
0 1 0 0 
+ (-1)*+* (ag) det 0 0 1 0 
0.00 > 0 1 


=(=H( EDF a + azt +- a 117241445 + (—1)tao(1) 
(por hipótesis de inducción y porque la segunda matriz es triangular) 

= (—1)* (ait + aot? +--+ ap—1t"7! + t") 4 (—D*a 

= (—1)* (ao + ait + azt? ++ apt"! + t"). 


5.3. Polinomios de matrices y de operadores 
Si A € Mataxn( K) y n > 0 es un entero, se definen las potencias 
A =I, y AMI=ZAP?.Asin>1. 


Es fácil probar (ejercicio 29) la regla de los exponentes: si m,n > 0 son enteros, entonces 
[Min = A™® A” 

Ahora, si a € K es un escalar y A* es la potencia k-ésima de una matriz cuadrada A, 
entonces se tienen definidos los productos a.A* y por lo tanto, si 


f(t) = ao + art + a2? +--+ ant” € K|t] 


es un polinomio con coeficientes a; € K, y si A € Mataxn(K) es una matriz cuadrada 
con entradas en K, se define 


f(A) := aoIn + a1 A+ a24? +--+ anA” 
de tal forma que f(A) € Matnxn(K). 
Lema 5.21. Sean A € Matnxn( K) y f(t), g(t) € K[t]. Entonces, 


D (F+9(4) = F(A) + g(4). 
O) (F: g9)(4) = F(A)g(A). 


DEMOSTRACIÓN. (1): Si (f + g)(t) = (ao + bo) + (a1 +b1)t +--+ (aj +bj)tf +-->, 
entonces 


(F+g9(4) = (ao + bo)In + (a1 +b1)A +-+: + (aj + bj) AÏ +- 
= (ao +a A+: + ajA +) + (bo tbi A+ HbA H) 
= f(A) + g(4). 


La parte (2) se demuestra en forma similar. 
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Si T : V — V es un operador lineal en un X-espacio vectorial, se definen las poten- 
cias 
T° =idy y T":=T""loT (composición de operadores) si n > 1. 

Es sencillo probar (ejercicio 30) la regla de los exponentes: T™ oT” = T"*" si m,n > 0 

son enteros. Si 
F(t) = ao + art + a2? +--+ ant” € Klt] 

es un polinomio con coeficientes a; € K, y si T : V — V es un operador lineal, se define 
F(T) := apidy+01T + aT? +--+ ap T* 

de tal forma que f(T) : V — V es un operador lineal. 


Lema 5.22. Sean T : V — V un operador lineal y f(t), g(t) € KT[t]. Entonces, 


(D (F+9 (1) = F(T) + g(T). 
O) (£- IND) = f(T) o g(T) (composición de operadores). 


DEMOSTRACIÓN. La parte (1) se demuestra en forma similar a la del lema anterior. Para 
la parte (2), si f(t) = ao + ait + -+< + amt™ y g(t) = bo + bit +-+- + bnt”, entonces 
Ft)g(t) = co + cit +- + ckt +--- donde cg = 5 a;bj. Se sigue que 


i+j=k 
(f - D(A) = coidy +T +--+ cT +- 
= (aobo) idy +(aobı AR ado) Ak + ( 5 aibj)T o TI +-+. 
i+j=k 
= (apidy +aıT +- -4 aiT’ 4 ==) o (boidy +T +- + bTI +) 
= f(T) o g(T). 


Proposición 5.23. Sea T : V — V un operador lineal en un K-espacio vectorial de 

dimensión finita n. Sea B una base de V y sea A = |T]g. Si f(t) € K|t], entonces 
AD) ls = f(A). 

DEMOSTRACIÓN. Sabemos que [idy]g = In y por hipótesis [T]g = A. Por otra parte, 

[72] g = [T]8[T]g = AA = A?. Por inducción se sigue que [T"]g = A* y el resultado es 

entonces inmediato. 


Gracias a esta proposición, lo que digamos de un polinomio de una matriz cuadrada 
es válido si lo enunciamos para el operador lineal correspondiente y viceversa. Así, en 
ocasiones sólo formularemos el resultado para una de estas instancias. 


Teorema 5.24. Sea A una matriz n x n con entradas en K. Entonces, existe un polinomio 
no nulo f(t) € K[t] tal que f(A) = 0. 


DEMOSTRACIÓN. El K-espacio vectorial Matnxn(K) tiene dimensión n? y así, para 
cualquier m > n? las m matrices 1,,, A, 4?,..., A” son linealmente independientes en 
Mata xn(K), i.e., existen escalares aj € K, no todos cero, tales que 


aoln +a A + a94? +++ an AT = 0 


por lo que el polinomio f(t) := ao+a1t+a2t?+: - -+amt™” € K[t] tiene algún coeficiente 
aj + 0 y satisface lo requerido. 
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Observación. Si el coeficiente de grado am % 0, dividiendo el polinomio f(t) entre am 
obtenemos un polinomio g(t) € K'T[t] con coeficiente de grado 1, i.e., de la forma 


g(t) = + dm TA +. ++ bit + do € Klt] 


y tal que g(A) = 0. A un polinomio con coeficiente de grado 1 se le llama un polino- 
mio mónico. Hemos así mostrado que si 4 € Mata xn(K), entonces existe un polinomio 
mónico g(t) € K[|t] tal que g(4) = 0. Por el principio del buen orden, existe un polinomio 
mónico de menor grado g(t) € K[t] tal que g(A) = 0. A un tal polinomio se le llama un 
polinomio mínimo de A. 


Lema 5.25. Sea A € Mata xn(K). Entonces, el polinomio mínimo de A es único. 


DEMOSTRACIÓN. Supongamos que p(t) y q(t) son dos polinomios mínimos de A; enton- 
ces p(t) y q(t) son del mismo grado, digamos m, y si 


p(t) =t"+amat + pat+ao y qe) =t” +bm-1t + --+bit+bo 

entonces, para r(t) = p(t) — q(t) = (ao — bo) + (a1 — bi)t +--+ + (m1 — bm-1)t™7! 

(ya que los términos de grado se eliminan) se tiene que gr(r(t)) < m ó r(t) = 0 y además 
r(A) =p(A) - a(A) =0—0=0, 

y así r(t) = 0 por la minimalidad del grado de p y q. Por lo tanto p(t) = q(t) como se 

quería. 


Proposición 5.26. Sea A € Mata xn(K) y sea pa[t) el polinomio mínimo de A. Si f(t) € 
K't] es cualquier polinomio tal que f(A) = 0, entonces pA(t) divide a f(t). 


DEMOSTRACIÓN. Usando el algoritmo de la división en X'[t], dividimos f(t) entre pa(t) 
para obtener 


(+) FE) = patat) + r(t) con r(t) =06 gr(r(t)) < gr(pa(t). 
Si sucediera que r(t) Æ 0, entonces de (+) se tendría que 
0 = f(A) = palAJa(A) + r(A) =0- g(A) + r(A) = r(A) 


por lo que r(A) = 0 con gr(r(t)) < gr(pa(t), en contradicción con la minimalidad del 
grado de pa(t). 


Teorema 5.27 (Hamilton-Cayley). Sea T : V — V un operador lineal en un K--espacio 
vectorial de dimensión finita n y sea py (t) el polinomio característico de T. Entonces, 


ọr(T) =0. 


DEMOSTRACIÓN. Mostraremos que ¿y (T)u = 0 para todo v € V. Si v = 0 esto es obvio 
porque Hy(T') es lineal. Supongamos entonces que v Æ 0 y sea W el subespacio T-cíclico 


generado por v. Sea r = dim g W. Como v, Tv,T?v,...,T"71v es una base de W, para 
el vector Tv € W existen escalares ay, a1, . .. ,@r—1 tales que 
(1) T”v = —agv — a Tu — aoT°w — sarta 


y el polinomio característico del operador Tw : W — W es 
(2) Prw (t) = (1) [ao + art + aat? 4 + t apt t] 


de tal forma que rw (Tw) = (—1)" [ao idw +a1Tw + a2T3; +--+ ar11 + Th] 
por lo que 


bry (T)v = (—1)" [aov + a1Tv + aoT°v +--+ an1 Tw +T] = 0 
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por (1) y (2). Finalmente, como rẹ divide a dy, se sigue que r(t) = q(t) dr, (t) por 
lo que ġr(T) = q(T) o rẹ (T) y así 
pr(T)v = a(T) (Pra (Tw) = a(T)(0) = 0, 


como se quería. 


Corolario 5.28. Sea T : V — V un operador lineal en un K -espacio vectorial de dimen- 
sión finita n y sean by (t) el polinomio característico de T y pr(t) su polinomio mínimo. 
Entonces, pr(t) divide a pr (t). 


DEMOSTRACIÓN. En general py (t) divide a cualquier polinomio que se anula en T. 


Sabemos que los valores propios de un operador lineal T (en un espacio de dimensión 
finita) son las raíces de su polinomio característico. El resultado siguiente nos dice que son 
las raíces de su polinomio mínimo. 


Teorema 5.29. Sea T : V — V un operador lineal en un K-espacio vectorial de di- 
mensión finita n y sea py (t) el polinomio mínimo de T. Entonces, un escalar A € K es 
un valor propio de T si y sólo si A es raíz de pr(t). Es decir, el polinomio mínimo y el 
polinomio característico de T tienen las mismas raíces. 


DEMOSTRACIÓN. Como pr divide a dr, r(t) = q(t)pr(t) y así todo cero de pr es cero 
de r. Recíprocamente, si A es un cero de r(t) y v es un vector propio correspondiente 
a A, entonces usando que Tv = Av y como pr(T)v = 0, escribiendo pr(t) = ao + aıt + 
+ ap 1171 + t", se tiene que 


0 = pr(T\w 
= (agidy +aıT + -< + ap- 114 TD 
= apidy v + aT +--+ ar11 T" lv + T"v 
= aov + a d+ + ar NT + AU 
(ya que, por inducción Tv = A*v) 
= (ao + aÀ +: H ap ATI Aw 
=pr(A) v, 


y como v % 0, la igualdad 0 = pr(A)v implica que pr (A) = 0, como se quería. 


4 1 0 

Ejemplo 10.SiA= | 0 1 O], su polinomio característico es 
1 1 4 
t 


4— 1 0 
dalt) =det | 0 1=% 0 | =(4-D1-D4-0=-(4-40*(-1) 
1 1 4-t 
por lo que su polinomio mínimo es f(t) = (t — 4)? (t — 1) ó g(t) = (t — 4)(t — 1). Para 
ver cuál de estas dos posibilidades es la correcta, observamos que 


01 À/⁄310 00 0 
ga =|fo -3 o [o o o|=|0 o 0 
310 

t 


1 1 0711 1 3 


por lo que necesariamente el polinomio mínimo es p4 (t) = (t — 4)? (t — 1). 
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Ejemplo 11. Si A = E 5) , Su polinomio característico es 


dato = de (1 Bab = (1-06-0-8=+(t-8) 


por lo que su polinomio mínimo es pa(t) = da(t). 


Observación. Como pr|ġr hay dos casos extremos: 


(1) Que tengan el mismo grado. En este caso ambos polinomios tienen las mismas raíces y 
las multiplicidades también son iguales; por lo tanto 


$r(t) = (-1)"pr(8. 
El teorema siguiente nos da un caso cuando ocurre ésto. 


(2) El otro caso extremo es cuando el grado de pr es el mínimo posible, i.e., cuando 
pr(t) = (t= A) + t= Ar) 


con A1,..., Ay todos los valores propios distintos de T. El segundo teorema que probare- 
mos a continuación nos dice lo que sucede en este caso. 


Teorema 5.30. Sea T : V — V un operador lineal en un K-espacio vectorial de dimen- 
sión finita n. Supongamos que V es T'-cíclico. Entonces, el polinomio característico pr y 
el polinomio mínimo pr tienen el mismo grado y por lo tanto 


$r(t) = (1) "pr(). 


DEMOSTRACIÓN. Por hipótesis existe un v € V tal que B = [v,Tv,T?v,...,T"=ly) 
es una base de V. Entonces, para todo polinomio g(t) € K[t] de grado k < n, digamos 
g(t) = ao + art + --- + agt! (con az Æ 0), se tiene que 


g(T)v = agu+aTv+a2T*wV+---+aT*w 


es decir, g(T)v es combinación lineal de elementos de B con el coeficiente az Æ 0, y así, 
como B es linealmente independiente, se debe tener que g(T')v Æ 0 por lo que la aplicación 
lineal g(T) 4 0. En particular, el polinomio mínimo p7-(t) no puede tener grado < n (ya 
que se anula en T) y por lo tanto gr(pr) = n = gr(dy). 


El teorema anterior nos da una condición para la cual el grado del polinomio mínimo 
pr es el mayor posible. Por otra parte, sabemos que gr(pr) > el número de los valores pro- 
pios distintos de T y el teorema siguiente nos dice lo que pasa cuando se tiene la igualdad, 
i.e., cuando gr(pr) = el número de raíces de Hr: 


Teorema 5.31. Sea T : V — V un operador lineal en un K-espacio vectorial de di- 
mensión finita n. Entonces, T' es diagonalizable si y sólo si el polinomio mínimo es de la 
forma 


pr(t) = (t= A1)-:-(t— Ax) 
donde A1,..., Ay son todos los valores propios distintos de T. 


DEMOSTRACIÓN. Supongamos que T es diagonalizable y sean A1, . . . , Ax los valores pro- 
pios distintos de T. Pongamos f(t) = (t — A1)--+(t — Ax). Como los A; son raíces de 
pr, entonces f(t)|py(t). Como T es diagonalizable, existe una base B = [v1,..., Un} de 
V consistende de vectores propios de T. Así, para cada v; € B existe un valor propio A; 


5.3. POLINOMIOS DE MATRICES Y DE OPERADORES 137 


tal que Tu; = Avj, es decir, (T — Ajidy)uz = 0. Ahora, como (t — A;)|.f (€), entonces 
F(t) = qi (t) (t — A;) por lo que 
Do, = (DD UT — A idy)uj) = qi(0) = 0, para todo v; € B, 


de donde se sigue que f(T)v = 0 para todo v € V ya que B es base de V. Se sigue que 
f(T) = 0 y por el teorema x.x esto implica que pr (t)|f(t) y como f(t)|pr(t), se sigue 
que f(t) = pr(t). 

Supongamos ahora que pr (t) = (t— à1) +++ (t — Ax). Mostraremos que T es diagona- 
lizable por inducción sobre n = dim x V. Si n = 1 no hay nada que probar. Supongamos 
ahora que la restricción Tw es diagonalizable para todo subespacio T-invariante de V de 
dimensión < n. Para el valor propio Az, sea W := Im(T — Ak idv ) C V y observemos que 
W S V ya que, para el valor propio Az existe un vector propio v Æ 0 en ker(T — Ax idy) 
por lo que (T — Ax idy ) no es un isomorfismo y por lo tanto no es suprayectivo (para ope- 
radores ser isomorfismo es equivalente a ser inyectivo o a ser suprayectivo) y así su imagen 
no es todo V. Ahora, si W = 0, se tendría entonces que T = Ax idy y por lo tanto T sería 
diagonal. Supongamos entonces que W +Æ 0. Claramente W es T-invariante (ver X.xX) y 
así por hipótesis de inducción la restricción Tw : W — W es diagonalizable y por lo 
tanto existe una base de W formada por vectores propios de Tw (y consecuentemente de 
T), digamos B' = {w1,..., Wr}. Sea Vr, (T) = ker(T — Azidy) C V, el espacio propio 
correspondiente a Az y sea B” = {v1,..., Um} una base de V}, (T). Observemos ahora 
que para todo w € W = Im (T — Az idy) se tiene que w = (T — Az idy w con v € V por 
lo que si calculamos la composición 


(T ES Az idy) 0 (T = Àk—1 idy )w = (T — Az idy) mos (T = Àk—1 idy )(T — Ax idy)u 
=pr(D)jv=0, 
ya que pr(T) = 0. Se sigue que el polinomio (t — A1) - + - (t— Ax-1) se anula en Tw y por 
lo tanto el polinomio mínimo de Tw divide a (t — A1) --- (t — Az-1) y consecuentemente 
Ay no es raíz de pr,,., i.e., no es valor propio de Tw. Se sigue que W N Vr, (T) = (0) y 
así B'NB” = Ø. Mostraremos ahora que B = B'UB" es base de V y para ésto, observemos 
primero que 
n = dimx V = dimx ker(T — Ax idy) + dimx Im(T — Ar idy) 
= dimx Vr, (T) + dimx W =m+r 


entonces basta mostrar que B es linealmente independiente. Esto último es directo, si 


awi +: + arWr + bivi +:**+0,7 0 =0 
aa A A_KÁK 
w v 


entonces w € W y v € V son tales que w + v = 0 y así w = —v E€ W N Va, (T) = {0} 
por lo que w = 0 = v y como B’ y B” son linealmente independientes, las igualdades 
anteriores implican que a; = 0 y b; = 0, para toda 1 y j. Se sigue que B es base de V con 
los w; vectores propios de Tw (y por lo tanto de T) y los v; € Vy, (T) ( y por lo tanto 
vectores propios de T), i.e., B es una base de V consistente de vectores propios de T y 
consecuentemente T es diagonalizable. 


4 1 0 
Ejemplo 12. La matriz A = |0 1 0 | del ejemplo 10 no es diagonalizable porque su 
1 1 4 


polinomio mínimo p4 (t) = (t — 4)? (t — 1) tiene raíces múltiples. 
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Ejemplo 13. La matriz A = 


=. oe 


1 0 
1 0 | tiene polinomio característico 
1 3 


4—t 1 0 
dalt) =det | 0 1-2 0 | =(4-9(01-0(3-8=-(t- 4)(t— 1)(t —3) 
1 1 3—t 


por lo que su polinomio mínimo pa(t) = (t — 4)(t — 1)(t — 3) no tiene raíces múltiples y 
por lo tanto A es diagonalizable. 


El teorema anterior determina el polinomio mínimo de un operador lineal diagona- 
lizable. En el capítulo siguiente veremos la forma que tiene el polinomio mínimo de un 
operador lineal no diagonalizable en dos casos generales: en el primero cuando el polino- 
mio característico se descompone en Kft] y en el segundo cuando no se descompone en 
factores lineales en K ft]. 


EJERCICIO 1. Considere las matrices siguientes: 


1 2 
(a) A= e € Mat2x2(R) 
0 —2 —3 
(b) A=|-1 1 -=1| € Mat3x3(R) 
2 2 5 
2 0 —1 
(c) A=|4 1 -—4] € Mat2x2(R) 
2 0 —1 
(d) A= E 2) € Matax2(C) 


(1) Calcule sus valores propios. 

(11) Para cada uno de sus valores propios calcule el espacio propio correspondiente. 
(111) En cada caso determine si existe una base de K” consistente de vectores propios. 
(iv) Si es así, diagonalize la matriz correspondiente y encuentre la matriz Q tal que 


Q7 AQ = diag(A¡). 


EJERCICIO 2. Sea T : P¿(R) — Pa(R) la función dada por T(f(x)) := f(x) + x f'(x). 
(1) Muestre que T es un operador lineal. 
(11) Encuentre los valores propios de T. 
Gii) Encuentre una base B de Pa (R) tal que [7] g es diagonal. 


EJERCICIO 3. Sea T : V — V un operador lineal en un X-espacio vectorial de dimensión 
finita. Demuestre que T es invertible si y sólo si A = 0 no es un valor propio de T. 


EJERCICIO 4. Sea T : V — V un operador lineal invertible en un K-espacio vectorial 
de dimensión finita. Demuestre que A € K es un valor propio de T si y sólo si A7* es un 
valor propio de T7!. 
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EJERCICIO 5. Si A = (a;¿) es una matriz n x n triangular superior, demuestre que los 
valores propios de A son las entradas en su diagonal principal. 


EJERCICIO 6. Si A es una matriz n x n similar a Af, con A € K, demuestre que A = A/,,. 


EJERCICIO 7. Si A es una matriz n x n que tiene un único valor propio, demuestre que 


A= Ah. 


EJERCICIO 8. Si A es una matriz n x n, demuestre que A y *A tienen el mismo polinomio 
característico y por lo tanto tienen los mismos valores propios. 


EJERCICIO 9. Sea A € Matnxn( K) y sea 
palt) = (DP + an 11774 ++ ait + ao € Klt] 
su polinomio característico. 
(1) Demuestre que ay = det(A). Concluya que A es invertible si y sólo si ay X 0. 
(11) Compare con el ejercicio 3 y explique. 
(iii) Demuestre que Tr(A) = (-1)"*an-1. 


EJERCICIO 10. Sea T : Maty xn (1) —> Mata x y (K) la función dada por T(A) =*A. 


(1) Demuestre que T es un operador lineal. 

(11) Demuestre que los únicos valores propios de T' son +1. 
(111) Describa los vectores propios correspondientes a cada valor propio de T. 
(iv) Encuentre una base de Mata 2 (IR) donde T sea diagonal. 

(v) Encuentre una base de Mat, x n (R) donde T sea diagonal. 


EJERCICIO 11. Sea F2 = Z/2Z = {0, 1) el campo con dos elementos. 


(1) Liste todas las matrices en Mata, 2(F2). 
(11) Calcule sus polinomios característicos. 


EJERCICIO 12. Sea A € Matnxn( K) y sea 
dalt) = (DP +an—1t7! +--+ at + ao € K|t 


su polinomio característico. Demuestre que si A es invertible (de acuerdo al ejercicio 9(1) 
esto es equivalente a que ay Æ 0), entonces 


E 1 n ¡n= n= 
A (JE AUT + an1 A"? +- aMn]. 


EJERCICIO 13. Use el ejercicio anterior para calcular A7! si 


I 2 1 
A=|0 2 3 
0 0 -—1 


EJERCICIO 14. Si A € Matnxn(K) tiene dos valores propios A1 # A2 y además la 
dimensión de E», (K) es n — 1, demuestre que A es diagonalizable. 


EJERCICIO 15. Sea T : V — V un operador lineal invertible en un K-espacio vectorial 
de dimensión finita. Suponga que los valores propios distintos de T son A,,...,A, con 


140 5. DIAGONALIZACIÓN 


multiplicidades mı, ..., Mp, respectivamente. Suponga que B es una base de V tal que 
[T] g es una matriz triangular superior. Demuestre que las entradas diagonales de [7] ¿ son 
los A; repetidos con su multiplicidad. 


EJERCICIO 16. Para cada uno de los operadores lineales T' siguientes, determine si el 
subespacio W dado es o no T-invariante. 
G) T : P¿(R) — P3(R) dado por T(f) = f'y W = Pa(R). 
Gi) T : R[x] — R[x] dado por T(f(x)) =xf(x) y W = Pa(R). 
(iii) T : R? — R? dado por T(a,b,c) = (a+ b+c,a+b+c,a+b+c) y 
W =((t,t,t) : teR). 
1 


(iv) T : C([0,1),R) > C([0, 1], R) dado por T(f(t)) = (/ F(a)dz) -ty W= 


{f € C([0,1],R) : f(t) =at+b para a,b € R}. 
(v) T : Matax2((R) — Mata2x2 (RR) dado por 


T(A) = E y) A y W=(A€Matoxa(R) : tA = A). 


PAS, 
> 


EJERCICIO 17. Sea T : V — V un operador lineal y sea W C V un subespacio T- 
invariante. Demuestre que W es f(T)-invariante para todo f(t) € Kft]. 


EJERCICIO 18. Sea T : V — V un operador lineal. Demuestre que la intersección de 
cualquier familia de subespacios T-invariantes de V es un subespacio T-invariante. 


EJERCICIO 19. Sean L,T : V — V operadores lineales en un K-espacio vectorial de 
dimensión finita tales que conmutan, i.e., Lo T = T o L. 


(1) Si A es un valor propio de L y E, (L) es el subespacio propio correspondiente, 
demuestre que Ex (L) es T-invariante. 
(11) Demuestre que L y T tienen un vector propio en común. 


EJERCICIO 20. Para cada operador lineal T : V — V y para el vector v € V dado, 
encuentre una base para el subespacio cíclico generado por el vector v. 


(i) T : R4 — R* dado por T (a,b,c,d) = (a + b,b — c,a + c,a + d) y v = e1. 
Gi) T : P¿(R) — P3(R) dado por T(f) = f” y v = z’. 


Gii) T : Mat2x2(R) — Mat2x2(R) dado por T(A) =*A y v = G a) 
Gii) T : P¿(R) — P2(R) dado por T(f) = f+ 2f y v = x. 


EJERCICIO 21. Sea T : V — V un operador lineal en un espacio vectorial de dimensión 
2. Demuestre que V es T-cíclico o T = o - idy, para algún escalar a € K. 


EJERCICIO 22. Sea T : V — V un operador lineal en un espacio vectorial de dimensión 
finita n. Demuestre que V es T-cíclico si y sólo si cada subespacio propio Ex(T) tiene 


dimensión 1. 


EJERCICIO 23. Sea T : V — V un operador lineal en un espacio vectorial de dimensión 
finita n. Si T tiene n valores propios distintos, demuestre que V es T-cíclico. 


EJERCICIO 24. Encuentre el polinomio mínimo de cada una de las matrices siguientes: 
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6 4 
3 Dl 
áwA=| 2 2 2 
-1 0 1 


EJERCICIO 25. Encuentre el polinomio mínimo de cada uno de los operadores siguientes: 
G) T : R? — R? dado por T(x, y) = (£ + y, £ — y). 
GD T : Pa(R) — P2(R) dado por T(f) = f+ 2f. 
Gii T : P(R) — Pa(R) dado por T(f(t)) = =t f (0 + F) + 2ft). 
(iv) T : Matnxn (R) —> Matnxn(R) dado por T(A) = tA. Note que T? = id. 


EJERCICIO 26. En los dos ejercicios anteriores, determine cuáles matrices u operadores 
son diagonalizables. 


EJERCICIO 27. Sea T : V — V un operador lineal en un K-espacio vectorial de dimensión 


finita n y sea pr su polinomio mínimo. Demuestre que T es invertible si y sólo si pr (0) # 
0 (en ambos lados se tiene el 0 € K). 


EJERCICIO 28. Si T : V — V es un operador lineal invertible en un K-espacio vectorial 
de dimensión finita n y si pr(t) = ao+aıt+:-+ap—1të7! +t" es su polinomio mínimo, 
demuestre que 


1 
T = -|T E + ar idy |. 
0 


(Vea el ejercicio 12). 


EJERCICIO 29. Si A € Matnxn(K) y m,n > 0 son enteros, demuestre que A™+” = 
ATA”, 


EJERCICIO 30. Si T : V — V es un operador lineal y m,n > 0 son enteros, demuestre 
que T™”+” = T” o T”, 


Capítulo 6 


Formas canónicas 


EMOS VISTO LAS VENTAJAS que tiene un operador lineal T diagonalizable, es decir 
H cuando su matriz asociada (en alguna base) es diagonal, lo cual es equivalente a que 
el espacio vectorial V tenga una base de vectores propios de T’. Sin embargo también vimos 
ejemplos de operadores lineales no diagonalizables aún cuando su polinomio característico 
dr se descomponga en factores lineales en K [t]. En este capítulo veremos distintas formas 
de poner al operador lineal T que, de alguna manera, están cercanas a la forma diagonal que 
estudiamos en el capítulo anterior. Como antes, la forma asociada al operador T depende 
de la elección de una base adecuada del espacio vectorial V en consideración. Debemos 
mantener en mente que lo que buscamos es que la matriz asociada al operador T se parezca 
lo más posible a una matriz diagonal. En este capítulo veremos tres de estas formas para el 
operador T, a las que se llaman formas canónicas. La primera de ellas, la forma triangular 
es fácil de obtener, la segunda forma canónica que estudiaremos, la forma canónica de 
Jordan es muy importante en matemáticas, en particular en el estudio de las ecuaciones 
diferenciales, pero requiere que el polinomio característico ġr del operador T tenga todas 
sus raíces en el campo K correspondiente, lo cual también se requiere para la existencia de 
una triangulación; la tercera forma canónica que estudiaremos, llamada la forma canónica 
racional, también es importante y a diferencia del caso anterior para su existencia no se 
necesita que el polinomio característico ġr se descomponga en Kft]. Cada una de estas 
formas canónicas tiene ventajas y desventajas, dependiendo de la aplicación que uno tenga 
en mente. 


6.1. Triangulación de operadores 


Si T : V — V es un operador lineal en un X-espacio vectorial de dimensión finita 
y si T no es diagonalizable, podríamos preguntarnos cuál es la matriz más simple que le 
podemos asociar al operador T. Para comenzar, en este contexto la expresión más simple 
podría querer decir que la matriz asociada a T' tenga muchos ceros. Un ejemplo de una tal 
matriz es una matriz triangular superior, i.e., una matriz de la forma 


(11 * 
A = 


0 Ann 


que tiene ceros en todas las entradas por debajo de la diagonal principal. Es claro que 
una matriz triangular superior se parece en algo, o en mucho, a una matriz diagonal y el 
problema que tenemos entonces es el siguiente: dado T : V — V un operador lineal 
en un K-espacio vectorial de dimensión finita, ¿existe una base B de V tal que la matriz 
asociada |[T]g sea triangular superior? Cuando esto suceda diremos que T es un operador 
triangulable. La proposición siguiente caracteriza esta situación. 
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Proposición 6.1. Sea T : V — V un operador lineal en un K-espacio vectorial de 


dimensión finita n y sea B = [v;,...,v, } una base de V. Las afirmaciones siguientes son 
equivalentes: 
(1) K(vi,..., vk) es T-invariante para cada k =1,...,n. 


(2) Tv; € K(v1,...,0x), para cada k=1,...,n. 
(3) La matriz [T] g es triangular superior. 


DEMOSTRACIÓN. Claramente (1) implica (2). Para la implicación (2) > (3), como Tv; € 
K(vı), entonces Tv; = avı para algún a11 € K. Ahora, como Tva € K(v1, v2), 
entonces existe escalares a12,0292 tales que Tv2 = a1241 + 09202. Similarmente, como 
Tvz € K(v1, vz, 3), entonces existen escalares a13, 423, a33 tales que Tug = 41301 + 
42302 + 43343. Procediendo recursivamente vemos que 


Tvi = Q111 

Tv = 01201 + 02202 

Tuz = 01301 + 02302 + 03383 

Tun =  (inU1 + A2n V2 + 043nU3 +: + GinUn 


y por lo tanto la matriz asociada a T, en la base B, es transpuesta de la matriz de coeficientes 
en las combinaciones lineales anteriores, i.e., 


0411 012 013 *:* Qin 

O az a23 > 02m 

[Tlg=| 0 0 03 ©: azn 

0 0 O --- dnm 

i.e., [T] g es triangular superior. 

Para la implicación (3) > (1) basta mostrar que Tv; € K(vy,...,Uz) para j = 
1,...,k. Para ésto, como [7] g es triangular superior, entonces usando las entradas en la 
columna j de la matriz [T]g como coeficientes de los vectores v1, ... , vj, Se sigue que el 


vector Tw; es combinación lineal de estos vectores y consecuentemente 
Tv; € K(v1,...,vj) para cada j = 1,...,k. 


Ahora, como K(vy,...,vj) € K(v1,..., Vg) para j = 1,...,k, entonces Tv; € 
K(v,,...,0x) para toda j =1,...,k y así K(vy,...,vx) es T-invariante. 


El resultado principal es: 


Teorema 6.2. Sea T : V — V un operador lineal en un K-espacio vectorial de dimensión 
finita n y supongamos que todos los valores propios de T están en K. Entonces, T es 
triangulable. 


DEMOSTRACIÓN. Por inducción sobre n = dimx V. Si n = 1 no hay nada qué problar. 
Supongamos ahora que el resultado es válido para todos los K-espacios vectoriales de di- 
mensión < n. Por hipótesis del teorema existe un valor propio A € K del operador T. 
Entonces existe un vector propio v Æ 0 con valor propio A y por lo tanto T — Aidy no es 
un isomorfismo y así no es suprayectivo (recuerde que para operadores lineales ser un iso- 
morfismo es equivalente a ser suprayectivo); entonces, si W = Im(T — Aidy) se tiene que 
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dimx W < n. Más aún, W es T-invariante por el ejemplo 7 del capítulo 4 y consecuente- 
mente la restricción T| y» : W — W es un operador lineal que, por hipótesis de inducción, 
es triangulable; sea 8’ = {w1,. .. , Wm } una base de W tal que la matriz correspondiente 
de T|w es triangular superior. Por la proposición anterior ésto es equivalente a decir que 


(1) Tw; =Tlw(w;) € K(w1,..., wj) paraj=1,...,m. 

Extendemos B' a una base de V, digamos B = [w1,...,Wm,U1,-..,Un } y observa- 
mos que, para cada k = 1,...,n se tiene que 
(2) Tug = Tug — Az + Avz = (T = Aidy)Uz + Aug 


y, como W = Im(T — Aidy) entonces (T — Aidy)uz € W = K(w1,..., Wm) y así la 
igualdad (2) dice que 


(3) Tvk E€ K(w1,..., Wm, Vk) C K(w1,..., Wm, U1,- -, Uk). 


De (1) y (3), usando la proposición anterior se sigue que T es triangular en la base B. 


Observación. La hipótesis fuerte en el teorema anterior es la suposición que T tiene todos 
sus valores propios en K. Por el teorema fundamental del álgebra esto sucede siempre si 
K = C. Sin embargo si K = R esto puede ser falso; el ejemplo 4 del capítulo anterior es 
un operador lineal en un R-espacio vectorial que no tiene valores propios reales. 


6.2. La forma canónica de Jordan. 


Para continuar en forma natural lo que hemos estado estudiando hasta ahora: valo- 
res y vectores propios, espacios propios y subespacios T'-cíclicos, la forma canónica que 
estudiaremos usa algunas generalizaciones de estos conceptos, con la desventaja de que 
requiere que el polinomio característico py se descomponga en Kft], i.e., que tenga to- 
das sus raíces en K. Esto sucede, por ejemplo si K = C por el teorema fundamental del 
álgebra. 

Recordemos que si T : V — V es un operador lineal en un K-espacio vectorial de 
dimensión finita tal que su polinomio característico py tiene todas sus raíces en K, sabe- 
mos que la diagonalizabilidad de T depende de que si al elegir una base $; de cada espacio 
propio Ex, (T) de T, la unión B = U 5; sea una base de V. Así, que T no sea diagonaliza- 
ble quiere decir que algunos espacios propios E,,(T') son demasiado pequeños, es decir, 
aún cuando los vectores propios, diferentes de cero, correspondientes a valores propios 
distintos de T, son linealmente independientes, en general, no generan a V, por ejemplo, 
0 e ) , tiene un único valor propio 
A = 0 y el espacio propio correspondiente E, (T) C C? tiene dimensión 1, por el ejemplo 
5 del capítulo 4. Se sigue que Ex(T) € V. 


el operador lineal T : C? — C? dado por la matriz ( o 


La idea entonces es extender estos espacios propios pequeños a espacios propios ge- 
neralizados para los cuales se tienen bases B; cuya unión sí es una base de V; sin embargo 
en este caso la matriz asociada a T, en la base $, no será diagonal, sino que tendrá la forma 


Mi EA A 
17 Mie o 

[Tls = , 
0 
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donde cada O es una matriz cero de tamaño adecuado y cada bloque Mj es una matriz 
cuadrada de la forma siguiente 


à 1 0 0 
0 à 1 0 
0 0 à 1 
0 T A 


j 
para algún valor propio A; de T. Observe que la matriz |[T]g, llamada la forma canónica 
de Jordan, está, en efecto, muy cerca de ser diagonal, de hecho en la diagonal principal 


de la matriz [7] g se encuentran todos los valores propios de T ya que éstos están en los 
bloques M;, llamados los bloques de Jordan de la forma canónica de Jordan. 


Para poder construir la base $ requerida, recordemos que si v € V es un vector propio 
asociado a un valor propio A de T, el vector v satisface que 


(T — àidy)v = 0 


pero como los vectores propios no son suficientes para generar todo V, necesitamos agregar 
otros vectores, que generalizan los vectores propios usuales, y que también están asociados 
a un valor propio A de T. 


Definición 6.3. Si T : V — V es un operador lineal en un K-espacio vectorial de dimen- 
sión finita n, un vector v 4 O de V se dice que es un vector propio generalizado de T, 
correspondiente al escalar A, si existe un entero p > 0 tal que 


(T — \idy)’v = 0. 


Observaciones. (1): Si v 4 0 es un vector propio de T asociado al valor propio A, entonces 
(T — Aidy w = 0 y así v es un vector propio generalizado de T, correspondiente al valor 
propio A, y con el exponente p = 1. 


(2): Si v 4 0 es un vector propio generalizado correspondiente al escalar A, por el principio 
del buen orden podemos escoger al menor entero positivo p > 0 tal que (T—Aidy)?v = 0. 
A este entero positivo menor se le llama el período del vector v con respecto a (T'—Aidy). 


(3): Si v Æ 0 es un vector propio generalizado de T con período p y asociado al escalar 
A, entonces (T — Aidy)?v = 0 y (T — Midy)”=lv Æ 0. Entonces, para el vector (T — 
Aidy)'=lu Æ 0 de V se tiene que 


(T — Midy) ((T — Aidy)7*4) = (T — Aidy)”v = 0, 


i.e., (T — Aidy)?™ tw es un vector propio de T con valor propio A. Hemos así mostrado 
que el escalar A en la definición de vector propio generalizado, de hecho es un valor propio 
de T. 


(4): El operador (T — Aidy)* conmuta con T para toda k > 1. Esto se demuestra por 
inducción sobre k. Para k = 1, se tiene que 


To(T-—A\idy)=ToT-—AT = (T — \idy) oT. 
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Suponiendo que la afirmación es válida para k, se tiene que 

To(T — Aidy)** = (T o (T — Aidy)*) o (T — Aidy) 
= (T — idy)” o T o (T — Aidy) hipótesis de inducción 
= (T — idy)" o (T — Aidy) por la validez para k = 1 
= (T — àidy)"t! o T. 


(5): Si A es un valor propio de T, entonces el operador (T—Aidy)* : V > V conmuta con 
cualquier otro operador (T — pidy)” de la misma forma. Esto se demuestra por inducción 
sobre £ > 1 y usando la observación 4 anterior. En efecto, para £ = 1, 


(T — Aidy)F o (T — pidy) = (T — Aidy)*oT — u(T — Aidy)* 
=T o (T — idy)" — (T — Aidy)* 
= (T — pidy) o (T — Aidy)* 
Suponiendo ahora válido para £ > 1, 
(T — Midy)* o (T — pidy)*! = (T — Aidy) o (T — pidy) o (T — pidy) 
= (T — pidy) o (T — Aidy)* o (T — pidy) 
(por hipótesis de inducción) 
= (T — idy )f(T — pidy) o (T — Aidy)* 
(por el caso £ = 1) 
= (T — idy)! o (T — Aidy)*. 
Definición 6.4. Sea T : V — V un operador lineal y sea A € K un valor propio de T. El 
espacio propio generalizado de T correspondiente a A es el conjunto 
Kx(T) := {vectores propios generalizados de T correspondientes a A} U {0}. 
Que el conjunto K, (T) es, en efecto, un subespacio vectorial de V es la primera parte 
de la proposición siguiente: 
Proposición 6.5. Sea T : V — V un operador lineal y sea A € K un valor propio de T. 
Entonces, 
(1) Ka (T) es un subespacio T-invariante de V que contiente al espacio propio Ex(T). 


(2) Para cualquier escalar u H A, la restricción de T — pidy a Kx(T) es inyectiva. 


DEMOSTRACIÓN. (1). Claramente E, C Kx(T) (escogiendo p = 1 en la definición de 
vector propio generalizado). Supongamos ahora que v,w € K,1(T). Entonces, existen 
enteros p > 0 y q > 0 tales que 


(T — Midy)v = 0 = (T — Aidy)%w 
y por lo tanto 
(T — idy)? (v + w) = (T — idy Pw + (T — idy) Pw 
= (T — Aidy)* ((T — A idv)” (v) 
+ (T — Aidy)? (T — Aid) (0) 
=0+0=0 
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y asív+w € Kx(T). Similarmente, si œ € K es cualquier escalar y v € Kx(T), entonces 
para el entero p > 0 tal que (T — Aidy)” = 0, se tiene 


(T — Midy)(av) = a(T — Aidy )Pv = a0 = 0 


por lo que av € K, (T). 
Finalmente, que K, (T) es T-invariante es porque si v € K) (T), escojamos p > 0 tal 
que (T — Aidy)Pv = 0. Entonces 


(T — Aidy )” (Tv) = T(T — Aidy)P(v) por la observación 4 previa 
=T(0)=0 
y por lo tanto Tv € K, (T). 


(2) Sea u Æ A otro escalar y supongamos que v € K}(T) es tal que (T — pidy)u = 0. 
Si v no fuera 0, sea p > O el menor entero tal que (T — Aidy)Pv = 0 y pongamos 
w := (T — idy )?™ tw £ 0. Entonces 


(T — Aidy)w = (T — Aidy )Pv = 0 
y consecuentemente w € Ea. Más aún, 
(T — pidy)w = (T — pidy(T — idy)? tv 
= (T — idy)?! (T — pidy)v por la observación 5 
(T — XMidy)”"*(0) yaque (T — pidy\w = 0 
0, 


y así w € E. Se sigue que w € Ex N E, = {0}, por lo que w = 0, una contradicción, a 
menos que v = 0 y consecuentemente (T — uidy ) es inyectiva en K) (T). 


Teorema 6.6. Sea T : V — V un operador lineal en un K-espacio vectorial de dimensión 
finita n. Supongamos que A € K es un valor propio de T de multiplicidad m. Entonces, 


(1) dimg(Ka(T)) < m. 

(2) KT) = ker(T — Aidy)”. 

DEMOSTRACIÓN. (1): Pongamos W := K, (T). Por la parte (1) de la proposición anterior, 
W es T-invariante y así podemos considerar la restricción Tw de T a W. Por la parte (2) 


de la proposición previa, A es el único valor propio de Tw y por lo tanto el polinomio 
característico de Tw es de la forma 


Prw (t) = (=D AF con k = dimg W. 
Ahora, como rẹ divide a or, entonces (t — A)¥|ġr(t) por lo que 
k < m= multiplicidad de A en r(t). 


(2): Es claro que ker(T — Aidy)”” C Kx(T). Para la otra inclusión, sean W y Tẹ como 
en la demostración de la parte (1). Por el teorema de Hamilton-Cayley 


0 = ry (Tw) = (-1)* (Tw — Aid)" 
y así (T — Aidy)"w = 0 para todo w € W. Ahora, como k < m por la parte (1), 


ésto implica que para todo w € W se tiene que (T — Aidy)”w = 0, es decir, w € 
ker(T — Aidy)”, por lo que KA (T) = W C ker(T — Aidy)””, como se quería. 


El resultado siguiente, que es clave para la descripción del operador lineal T, nos dice 
que los vectores propios generalizados de T, sí generan a V: 
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Teorema 6.7. Sea T : V — V un operador lineal en un K-espacio vectorial de dimen- 
sión finita n y supongamos que su polinomio característico py se descompone en K'[t]. 
Entonces, los vectores propios generalizados de T' generan a V. 


DEMOSTRACIÓN. Por inducción sobre n = dimg (V). Si n = 1, no hay nada que probar 
ya que existe un único valor propio A de T de multiplicidad 1, y K\(T) = EX(T) = 
V. Supongamos ahora que n > 1 y que el resultado es válido para todos los espacios 
vectoriales W de dimensión < n. Como Hr se descompone en K[t], sea A € K un valor 
propio de T de multiplicidad m. Mostraremos primero que 


V = ker(T — Aidy)”" Q Im(T — Aidy)”, 
a mm ai, 
vi; Va 


y para ésto, supongamos que v € Vi N Va. Entonces, (T — Aidy)™v = 0 y además 
v € Im(T — Aidy)”, i.e., existe un u € V tal que v = (T — Aidy)™u. Aplicando 
(T — Aidy)” a ambos lados de esta última igualdad se obtiene que 


0=(T — \idy)™”v = (T — Aidy)*”u, 


i.e., u es un vector propio generalizado de T correspondiente al valor propio A, i.e. u € 
Kx(T) = ker(T — Aidy)” y por lo tanto (T — Aidy)”u = 0, i.e., 


v = (T — Aidy)"u=0, 


i.e., V1 O Va = {0}. Mostraremos ahora que V + V2 = V. En efecto, como (T — Aidy)™ : 
V => V y Vi = ker(T — Aidy)””, Va = Im(T — Aidy )™, entonces 


dim(V) = dim(V1) + dim(V2) = dim(Vı O Va) 


y como Vi O Va C V, la igualdad anterior implica que V, $ Va = V. 

Observe ahora que Vı 4 {0} ya que A es un valor propio de T y por lo tanto existe un 
04 v € P(T) C ker(T — Aidy)” = Vi. Así, dim(V,) > 1 y por lo tanto dim(Va) < n. 
Más aún, como To(T'—Aidy)” = (T — A idy)” oT, entonces Va es T-invariante y así T 
induce, por restricción, el operador lineal Tə : Va —> V2. Por hipótesis de inducción Va 
está generado por los vectores propios generalizados de Th (los cuales obviamente también 
son vectores propios generalizados de T); y como los vectores de V = ker(T — Aidy )” 
son vectores propios generalizados de T y como V = V¡ O V2, entonces V está generado 
por los vectores propios generalizados de T, como se quería. 


Así como los vectores propios correspondientes a distintos valores propios son lineal- 
mente independientes, sucede lo mismo con los vectores propios generalizados: 


Teorema 6.8. Sea T : V — V un operador lineal en un K'-espacio vectorial de dimen- 
sión finita n y supongamos que su polinomio característico py se descompone en K|t]. 
Entonces, los vectores propios generalizados distintos de cero, correspondientes a valores 
propios distintos de T, son linealmente independientes. 


DEMOSTRACIÓN. Supongamos que v1, ..., Uy son vectores propios generalizados de T, 
correspondientes a valores propios distintos A1,..., Ay, de multiplicidades m;, respectiva- 
mente. Supongamos que se tiene un combinación lineal 
(x) 0101 +- + arvur = Q. 
Mostraremos primero que a, = 0. Para ésto, sea p el período de v; (i.e., el menor entero 
positivo p > 0 tal que (T — A1 idy)?v1 = 0). Apliquemos el operador 

L= (T — A idy)?™} o (T — Azidy)"? o +- o (T — Apidy)"" 
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a ambos lados de (x), recordando que los operadores en la composición anterior conmutan 
y que v; € Ky, (T) = ker(T — à; idy )™+, se obtiene que L(v;) = O para toda j =2,...,r 
y así (x) queda 


(+) a(T — idy) UT — Azidy)"?---(T — Apidy)”"v, =0 

la cual podemos re-escribir como 

(1) (T — Agidy)2.-(T — Ar idy)” a (T — A idy)” tw; = 0 

donde (T — Ajidy)™ es inyectiva en K), (T) para j = 2,...,r y por lo tanto la com- 


posición (T — Azidy )™2 o -- -o (T — Ar idy )™” es inyectiva en K,, (T) y así (1) implica 
que ay (T — A idy)? tv; = 0, con (T — A idy)?7t01 Æ 0 (por definición de período). 
Se sigue que a, = 0. En forma similar se muestra que ag = 0, ..., 4, = 0, como se 
quería. 


Los dos teoremas anteriores nos dan el siguiente teorema de estructura: 


Teorema 6.9. Sea T : V — V un operador lineal en un K-espacio vectorial de dimensión 
finita n y supongamos que su polinomio característico py se descompone en K|t]. Sean 
A1,..., Ar los valores propios distintos de T, con multiplicidades mi,...,my, respecti- 
vamente. Para cada j =1,...,r, sea Bj una base de Ky; (T). Entonces, 

(1) B; N Bj = 0), para 1 Æ j. 

(Q) B=B,U---UB,. es una base de V. 

(3) dimx(K,,(T)) = mj. 


DEMOSTRACIÓN. (1): Siv € Bi N B; € Ky,(T) N Ky,(T) con i # j, entonces v € 
Ky,(T) y v H 0 ya que está en una base. Se sigue que (T — A¡idy)?v Æ 0 para toda 
p > 0, ya que (T — A; idy) es inyectiva en K, (T) porque i 4 j y por la proposición 3. 
Pero esto contradice el hecho de que v € K»,(T). Se sigue que B; N B; = 4. 

(2): Por el teorema 6.5, los vectores propios generalizados generan a V y así para todo 
v E V existen v; € K»,(T') tales que v = vı + +++ + vr. Ahora, como cada v; € Ky, (T) 
es combinación lineal de la base B;, entonces v es combinación lineal de B y por lo tanto 
B genera a V. Pongamos ahora d; := dimk(K,,(T)) = |B,|, y sea d = |B|. Entonces, 

d = |B|= 5 |B:| por la parte (1) 


i=l 


= 5 di < 5 m; ya que d; < m; por el teorema 6.4 


i=1 i=1 
= gr(ġr) ya que los m; son las multiplicidades de las raíces de by 


Se sigue que d < dimx(V). Por otra parte, como B genera a V, entonces dimx(V) < 
|B| = d. De las dos desigualdades anteriores se sigue que d = |B| = dimg (V) y por lo 
tanto B es base de V. 


(3): En las desigualdades de la demostración de la parte (2) se tienen igualdades y por lo 


tanto a P 
Na=Em 
je] i=1 


con di < my, para toda 2, y así no puede suceder que algún d; < m,, i.e., se debe tener que 
di = my, para toda 2. 
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Corolario 6.10. Sea T : V — V un operador lineal en un K -espacio vectorial de dimen- 
sión finita n y supongamos que su polinomio característico py se descompone en K|t]. 
Entonces, T es diagonalizable si y sólo si Ex, = Kx,(T), para todos los valores propios 
Ai de T. 


DEMOSTRACIÓN. Por un teorema previo sabemos que T' es diagonalizable si y sólo si 
dimx Ea, = my, para todos los valores propios A; (de multiplicidad m;). Por la parte (3) 
del teorema anterior se tiene que m; = dimx Kx,(T). Así, T es diagonalizable si y sólo si 
dimx Ex, = dimx Kx,(T), para todos los A;, y como Er, € Kx,(T), esto último sucede 
si y sólo si Ex, = Kx,(T). 


Nuestro objetivo ahora es seleccionar bases adecuadas para cada espacio propio ge- 
neralizado K\,(T) donde el operador T restringido tenga forma de bloques de Jordan y 
luego usar el teorema anterior para obtener la forma canónica de Jordan de T. Veremos 
dos maneras de hacer lo anterior y para una de éstas necesitaremos reducir el problema a 
operadores nilpotentes y el corolario siguiente nos dice que los operadores (T — Aidy) en 
K, (T) son nilpotentes. 


Corolario 6.11. Sea T : V — V un operador lineal en un K -espacio vectorial de dimen- 
sión finita n y supongamos que su polinomio característico py se descompone en K|t]. 
Sean Az,..., Ay los valores propios distintos de T. Entonces, 


(1) Las restricciones (T — Aj idv )|x, (r) son nilpotentes. 
3 


(2) Cada restricción Pl, (r) tiene un único valor propio, Aj. 


DEMOSTRACIÓN. (1): Sea m; la multiplicidad de A;. Por el teorema anterior m; = 
dimx(K,,(T)) y como K»,(T) = ker(T — Ajidy)”, entonces para todo v € K»,(T) 
se tiene que (T — à; idy )™ (v) = 0, y así (T — Ajidy)”% = 0 en K»,(T), lo cual prueba 
0). 

(2): Sabemos que K\, (T) es T-invariante. Ahora, si A es un valor propio de T| x, (1) y 
si v 4 0 es un vector propio (en K,,(T')) correspondiente, entonces T(v) = Xv y así 


(T — Ajidy)u= Tv — Aju= (X — Aj)u 
y por lo tanto 
(x) (T — Ajidy)*w =(M —A¿)v para todo entero k > 0. 


Ahora, como v € Ky,(T') es un vector propio generalizado de T correspondiente a 
Aj, entonces existe un entero k > 0 tal que el lado izquierdo de (x) se anula. Se sigue que 
existe un k > 0 tal que (A — A¿)%v = 0 con v 4 0 y por lo tanto el escalar (M — Aj)" =0 
para algún k > 0. Consecuentemente A” — Aj = 0, i.e., A = Aj, como se quería. 


La ruta nilpotente. Nuestro objetivo ahora es mostrar que para un operador nilpotente 
T : V — V en un espacio vectorial de dimensión finita n existe una base de V tal que la 
matriz asociada a T es una matriz de bloques de Jordan. El primer lema nos muestra cómo 
son estos bloques y el tercer lema nos muestra cómo separar el operador T en suma directa 
de bloques de Jordan. El resultado principal es el teorema 6.13 consecuencia de los tres 
lemas que probaremos primero. 


Lema 6.12. Sea T : V — V un operador nilpotente en un K-espacio vectorial V de 
dimensión finita n y sea m > 0 el menor entero positivo tal que T™ = 0. Entonces, existe 
un vector v € V tal que v, Tv, T?v, ..., T™ tw es linealmente independiente. Sea W C 
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V el subespacio generado por el subconjunto C = [v,Tv,T?v,...,T""ly) anterior y 
sea Tw la restricción de T a W. Entonces, 


(1) W es T-invariante. 


0 1 0 0 
0 0 1 0 
(2) [Tw]c = n, 0 
0 +... 0 0 1 
0 A 0 


DEMOSTRACIÓN. Como T™ = 0 pero T""=! Æ 0, entonces existe un v € V tal que 
T"=Ly Æ 0. Veremos que éste es el vector v que nos sirve. Para ésto, supongamos que se 
tiene una combinación lineal 


aov + aiTu + aoT?v +--+ am- 1T” 1w = 0 
y supongamos que algún escalar a; es 4 0; sea as el primer escalar 4 0. Entonces, 
O=a.Tv+--+amaT”"ty= (asidy +09 T +---+am TT 


y como as Æ 0, entonces as idy +as+41T +- +am-1T™7 1: es invertible y por lo tanto 
T*v = 0, cons < m — 1 < m, una contradicción. Se sigue que tal as no existe y por lo 
tanto todos los a; = 0, como se quería. 

(A): Si T7=y € C, para 1 < i < m, entonces T(T”"="y) € C ó T(T”" y) = 0; en 
cualquier caso T(T"""*%w) € W y por lo tanto W es T-invariante. 


(2): Pongamos wı = v,wa = Tv,...,Wm = T”" ly para la base de W. Aplicando T a 
cada uno de estos vectores y escribiendo el resultado en términos de la base w1,...,Wn, 
obtenemos: 

Tw = Tu = 0-wi+1-w 

Two = Tu = 0-0/+0:-w->+1-0w3 

TWwm-1 > pmoly = 0- Wi 0. Wm-1 + 1. Wm 

TWwm = T”w=0 = 0:w>+-:::+0:Wmnm-1 +0: Wm 


y por lo tanto la matriz asociada a T restringida a W es la matriz deseada. 


Lema 6.13. Sea T : V — V un operador nilpotente en un K-espacio vectorial V de 
dimensión finita n y sea m > 0 el menor entero positivo tal que T™ = 0. Sea W C V el 
subespacio generado por el subconjunto C = {v, Tv, T?v, ..., T™ tv} dado por el lema 
anterior. Si w € W es tal que T™ "w = 0 con 0 < k < m, entonces w = T*u para 
algún u € W. 


DEMOSTRACIÓN. Como C = {v, Tv, T?v,..., T™ 1v} es base de W, entonces w € W 
es de la forma w = agv + a1Tv + -- -+ am- 1T™ lo. Así 


0 = Tkw = aoT™Ău + a T Fto a pando 


(ya que para el índice k — 1, el exponente de T es m — k + k — 1 = m — 1, y para índices 
mayores que k — 1 el exponente £ de T es > m y por lo tanto Tv = 0 ). Ahora, como 
T"=ky,...,T” twv es un subconjunto de C, entonces son linealmente independientes, por 
lo que la igualdad anterior implica que ay = aj = +: = ak—1 = 0. Se sigue que 


w=apT*v+-+>**+4am 1T tw = T" (apv +akyı Tu + amiT F-to) 
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¿pmok=1 


y así, para u = axU + Ax41¡ TU +++: + am-1 v € W, se tiene que w = T*(u), 


como se quería. 


Lema 6.14. Sea T : V — V un operador nilpotente en un K-espacio vectorial V de 
dimensión finita n. Sea W C V el subespacio T-invariante generado por el subconjunto 
C = {v, Tv, T?v,..., T™ tw} dado por el lema anterior. Entonces, existe un subespacio 
T-invariante U C V tal que V = W Ẹẹ U. 


DEMOSTRACIÓN. Sea U C V el subespacio T-invariante de mayor dimensión tal que 
WAU = {0}. Mostraremos que V = W + U. Supongamos que esto no sucede; entonces, 
existe un vector v € V tal que v ¢ W + U. Ahora, como T™ = 0 para algún m, y como 
v Æ 0, entonces T% = v g W +U pero T™v = 0 € W + U. Por lo tanto, existe un 
entero k, con 0 < k < m tal que T'v € W + U pero T'v ¢ W + U para todo i < k. 
Escribamos T*v = w + u con w € W y u € U. Se tiene que 


(x) 0 = T”v = TYE (TEv) = TE (w + u) = T Ew + Tu. 


Ahora, como W y U son T-invariantes, entonces T""*w € W y T”""*u € U. De (x) 
se sigue que T""w = —-T™-Fu € U, por lo que ambos están en W N U = (0) y 
así T™ Fu = 0 = T"=*o, Por el lema anterior esto implica que w = T*w” para algún 
w' € W. Se sigue que 
Tv = w +u = Tw +u 

y por lo tanto TE (v — w”) = u € U, y como U es T-invariante, la última igualdad implica 
que T” (v — w') € U para toda r > k. 

Por otro lado, si ¿< k, entonces T’ (v — w”) = T'v— Tiw' g W + U ya que de otra 
manera se tendría que 

t ha) 0 ti 
Tv=Tw +T'(v- w) €W +U, 
ew eU 

en contradicción con la elección de k. 

Pongamos z := v — w' y sea U el subespacio de V generado por z, Tz, ..., T*=*2 
y U. Observe que como z ¢ U y como U D U, entonces dim kx U > dimx U. Más aún, 
como T*z € U y como U es T-invariante entonces U también es T-invariante. Y como 
V = W +U, entonces V = W + Ŭ. Por la maximalidad de U se debe tener que WN U A 
{0} y por lo tanto debe existir un vector de la forma wo +a12+a29T2+:--+ aj T*=*2 en 
W NÙ con wo € W. Observe que no todos los a; son 0, ya que de lo contrario se tendría 


que 0 4 wọ € UN W = {0}, una contradicción. Sea pues a, el primer coeficiente a; 
distinto de O. Entonces 


wo+a.T* lia Tz +- -+a TT} = wo + (as +as+ıiT +--+ DO O E 


es un elemento de W y como as % 0, el operador (as + as+ıT +- + ag T*=8) es 
invertible por el ejercicio 9 del capítulo 5, y por el ejercicio 12 del mismo capítulo su 
inverso L es un polinomio en T. Como U y W son T-invariantes, entonces son g(T')- 
invariantes para cualquier polinomio g(t) € K[t], en particular son invariantes bajo el 


operador (as + as+1T +-+- + ax T*=*) y por lo tanto también son invariantes bajo L. 
Ahora, como wọ € W y como wa + (as + 4:41 T +- + apT*=9)T* 12 € W, 
entonces (as + as41T +-+- + a T*=9)T*=12 € W y por lo tanto, aplicando L, se sigue 


que T512 = L((as + as+ıT +++ +axT*-*)T* 12) € W. Por lo tanto 
wo +TTtze W 
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y como wọ € W, se sigue que T*712 € W C W + U. Pero como s — 1 < k, lo anterior 
contradice la afirmación del segundo párrafo de la demostración. Se sigue que W +U = V 
y como W N U = {0}, esto implica que V = W ẹ U. 


Usando dos de los lemas anteriores obtenemos la forma canónica de Jordan de un 
operador nilpotente: 


Teorema 6.15. Sea T : V — V un operador nilpotente en un K-espacio vectorial V de 
dimensión finita n. Sea nı > 0 el menor entero positivo tal que T™ = 0, Entonces, existe 
una base B de V tal que 


Mn 0 0 0 
0 Mn, 0 0 
[T]s = 
0 
0 - 0 0 Mn, 
0 1 0 0 
0 0 1 0 
donde cada bloque M; = : a o | es de tamaño nj X nj y nı > 

O sse 07-0 1 
0 0 


Na > -+ > np conny +na +: + nr =n = dimg (V). 


DEMOSTRACIÓN. Por el lema 6.12, si W; C V es el subespacio generado por v,,Tv],..., 
Tr1=1y,, entonces existe un subespacio T'-invariante U C V tal que V = W, 9 U. 
Escojamos cualquier base U de U. Entonces, B = {v1, Tv1, ... ¿Truly) UU es base de 
V y la matriz asociada a T en esta base es de la forma 


Mn, 0 
0 Az 
con A = [Tu ly. Ahora, como T”! = 0, entonces de = 0 para algún entero na < nı 


(escogemos el menor entero positivo na con esta propiedad). Repetimos el argumento para 
el espacio vectorial U y el operador nilpotente Ty : U — U. 


Usando este teorema y el corolario 6.9 se obtiene la forma canónica de Jordan de cual- 
quier operador lineal T : V — V, no necesariamente nilpotente, con la única condición 
de que T tenga todos sus valores propios en K. En efecto, si A1,..., Az son todos los va- 
lores propios distintos de T, por el corolario 9 los operadores (T — A; idy) restringidos a 
K»,(T) son nilpotentes. Entonces, por el teorema anterior existe una base B; de K»,(T) 
tal que 


6.2. LA FORMA CANÓNICA DE JORDAN. 155 


donde cada bloque M; es de la forma 


0 1 0 0 
0 0 1 0 
M; = EN 0 
0 0 0 1 
0 0 
Se sigue que 
Aj 0 0 >œ 0 Mn, 0 0 -.. 0 
0 à 0 > 0 0 Mn 0 > 0 
[(Tle, =| . + E . 
; ta 0 : . 0 
0. -- 0 0 àj 0 e 0 0 Mna 


y así, poniendo Mn, igual a la suma de M,,, con la matriz diagonal correspondiente se tiene 
que la matriz asociada al operador T (restringido al espacio propio generalizado K, (T')) 
es de la forma 


Mn, 0 Ds 0 
0 Mn 0 >} 0 
[T]s, E E 
0 
0 0 0. Mo, 
Aj 1 0 0 
0 Aj 1 0 
donde cada bloque M, = : i 0 es de tamaño nÍ x nÍ y ni > 

0O > 0 àj 1 
0 pet Aj 


ný >- > ni conni +n} +- +ni =n = dimx Ky, (T). 

Ahora, por el teorema 6.7 la unión de las bases B = B1 U- - - B, de los espacios propios 
generalizados XK», (T) es una base de V y por lo tanto la matriz asociada a T en esta base 
es de la forma 


Ple 000 o teo 0 
0 Ts, 0 = 0 
[T]s = , , 
: ES 0 
0 ES o 0 fa, 


Hemos así probado el resultado deseado: 


Teorema 6.16. Sea T : V — V un operador lineal en un K-espacio vectorial V de dimen- 
sión finita n. Supongamos que el polinomio característico py de T se descompone en Kjt] 
y sean Az,..., Ay los valores propios distintos de T con multiplicidades m1, M2, .. . My 
respectivamente. Entonces, existe una base B de V tal que la matriz asociada a T en esta 
base es de la forma 


Mn: 0 0 0 
O Ma 0 0 

[T]s = l 
0 0 0 Mha 


d 
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Aj 1 0 0 
0 à 1 0 
donde cada bloque es de la forma M, e= ke 0 
0 0 àj 1 
0 de Àj 


La ruta de los ciclos disjuntos. Nuestro objetivo es el mismo, es decir, mostrar que para 
un operador arbitrario T : V — V en un espacio vectorial de dimensión finita n existe 
una base de V tal que la matriz asociada a T' es una matriz de bloques de Jordan. Por el 
teorema 6.7 basta encontrar bases adecuadas de los espacios propios generalizados K»,(T) 
asociados a los valores propios de T. De nuevo, estamos asumiendo que el polinomio 
característico de T tiene todas sus raíces en K. Supongamos entonces que A es un valor 
propio de T y sea v Æ 0 un vector propio generalizado de T asociado a A. Sea p > 0 el 
menor entero positivo tal que (T — Aidy )Pv = 0. El conjunto 


C := {(T — idy)? w, (T — Aidy)??0,...,(T — Aidy)u,v) 


se llamará un ciclo de vectores propios generalizados de T correspondientes al valor propio 
A. El vector (T — Aidy)?7*u se llama el vector inicial del ciclo y el vector v se llama el 
vector final del ciclo. Diremos también que la longitud del ciclo es p. 

Observe que el vector inicial del ciclo es el únivo vector propio de T, con valor propio 
A, en todo el ciclo C. Observe también que si v es un vector propio de T, entonces C = {v} 
es un ciclo de longitud 1. 


Lema 6.17. Sea T : V — V un operador lineal en un K-espacio vectorial de dimensión 
finita n. Sea A € K un valor propio de T y sea v £ 0 un vector propio generalizado de T 
correspondiente a A y de período p. Entonces, el ciclo 


C := {(T — idy)? w, (T — Aidy)??0,..., (T — Aidy)v, v} 
es linealmente independiente. 
DEMOSTRACIÓN. Supongamos que se tiene una combinación lineal 
(x) ap1[T — idy)” Ttv +--+ a (T — Aidy)u+ aov = 0 


con los a; € K. Aplicando (T — Aidy)”™! a ambos lados de (+) y recordando que (T — 
Aidy)*v = 0 para todo k > p, obtenemos 


ap—10 +: < + a10 + ao(T — Aidy)”™ w = 0, 


i.e., ao(T — Aidy)P?T tw = 0, y como el vector (T — Aidy)?™ tv Æ 0, la igualdad anterior 
implica que ay = 0. Así, (*) queda 


(+) ap (T — idy)? tv +--+ ar (T — Aidy)u = 0. 
Aplicando ahora (T — Aidy)?"? a (f), obtenemos 
ap—10 +: + a20 + 01 (T — Aidy)”™ tw =0, 


i.e., ar(T — Aidy)?™tw = 0, con (T — Aidy)P?™tw Æ 0, por lo que la igualdad anterior 
implica que a, = 0. Procediendo recursivamente se prueba que a; = 0, para toda j, como 
se quería. 
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Corolario 6.18. Sea T : V — V un operador lineal en un K -espacio vectorial de dimen- 
sión finita n. Sea A € K un valor propio de T y sea v 4 0 un vector propio generalizado 
de T correspondiente a A y de período p. Considere el ciclo 


C := {(T — idy)? w, (T — Aidy)??0,..., (T — Aidy)v, v} 


y sea W el subespacio de V generado por el ciclo C. Entonces, W es T-invariante y la 
restricción |Tw]c es un bloque de Jordan. 


DEMOSTRACIÓN. Por el lema anterior C es linealmente independiente y así C es base de 
W. Denotemos los elementos de la base C mediante 


w] = (T = Aidy) Ttw 
Wa = (T E Aidy) 


Wi = (T = Aidy)"w 


Wp = v. 
Para comenzar aplicamos T’ a los vectores w;. Comenzamos con w observando que 
(T — Aidy)wı = (T — Aidy)?v=0 
por lo que 
(1) T(w1) = Aidy wı = àwı. 
Ahora, si ¿ > 1, entonces 
(T — Xidy)w; = (T — àidy)(T — Aidy)?™tv = (T — Midy)PDy = wi 
y por lo tanto 
(2) T(w;) = Aidy wi + W,-1 = àw; + 0,1. 


Se sigue que T manda a la base C en W y por lo tanto W es T-invariante. Más aún, 
como para obtener la matriz asociada a T, en la base C, primero aplicamos T a los vectores 
w; y luego al resultado lo expresamos como combinación lineal de los w;, las igualdades 
(1) y (2) anteriores nos dan las combinaciones lineales deseadas, de tal forma que la matriz 
correspondiente es la matriz transpuesta: 


A 0.0 0 à 1 0 0 
1 Aà 0 0 0 A 1 0 
[Tw]e =transpuesta de a o l= E s 
0 1 A 0 0 0 A 1l 
0 1. A 0 À 


i.e., es un bloque de Jordan. 


Corolario 6.19. Sea T : V — V un operador lineal en un K-espacio vectorial de di- 
mensión finita n. Supongamos que el polinomio característico py de T se descompone en 
K y sean Ai,..., Ay todos los valores propios distintos de T. Supongamos que para cada 
espacio propio generalizado Ky,(T') existe una base B; que es la unión disjunta de ciclos 
de vectores propios generalizados de T. Entonces, la unión B de las bases B; es una base 


de Jordan de V. 
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DEMOSTRACIÓN. Como B = Bı U---UB, es una base ordenada de V y como cada B; 
es unión de ciclos de vectores propios generalizados de T, el corolario anterior aplicado a 
cada ciclo B, implica que [T] g está en forma de Jordan. 


A la luz de este corolario, nuestro objetivo ahora es mostrar que, bajo las condiciones 
del corolario, existen bases de cada espacio propio generalizado K»,(T') que son uniones 
disjuntas de ciclos de vectores propios generalizados de T’. El teorema siguiente va en esa 
dirección. 


Teorema 6.20. Sea T : V — V un operador lineal en un K-espacio vectorial de di- 
mensión finita n y sea A un valor propio de T. Supongamos que Cy, ..., Cq son ciclos de 
vectores propios generalizados de T' correspondientes al valor propio A y tales que los 
vectores iniciales de cada ciclo Cy son distintos y forman un conjunto linealmente inde- 
pendiente. Entonces, 


(D) C¿NC;=0, para toda i 4 j. 


q 
(Q) C= U C; es linealmente independiente. 
i=1 
DEMOSTRACIÓN. (1): Si i # j, los vectores iniciales de los ciclos C; y C; son diferentes, 
digamos (T — Aidy)P"lo, 4 (T — Aidy)?71v. Ahora, si existiera un vector común 
a ambos ciclos, digamos (T — AJP+7*p, = (T — AMidy)?7*v;, sin perder generalidad, 
supongamos que p; — k < pj — t. Entonces, 


(T — Midy) lo; = (t — idy)! o (T — Aidy)” "v; 
= (T —Aidy)*"* o (T — Aidy)?i o, € C; 


y por lo tanto el ciclo Cj contendría dos vectores propios de T con valor propio A, una 
contradicción (con la observación previa al lema 6.15). Se sigue que C; NC; = Ó. 


(2): Mostraremos que C es linealmente independiente por inducción sobre su cardinal |C]. 
Si |C| = 1 no hay nada que probar. Supongamos ahora que el resultado es válido para todo 
C’ tal que |C'| < n y supongamos que C tiene exactamente n vectores. Sea W el subespacio 
generado por C; entonces dimx W < n porque C tiene n elementos. Más aún, como los 
generadores de W son elementos de algún C;, i.e., pertenecen al algún ciclo de vectores 
propios generalizados de T, i.e., son de la forma w = (T — A idy)?*u, entonces 


(T — idy )(w) = (T — A idy)? +w 
que es el vector cero o es un vector del mismo ciclo C;. En cualquier caso se tiene que 
(T — Aidy)w € W y por lo tanto W es (T — Aidy)-invariante. Sea L la restricción 


Para cada į tal que 1 < i < q, sea C; el ciclo obtenido quitando el vector final de C; 
(a menos que C; tenga longitud 1, en cuyo caso ponemos C} = Ø). Si C; 4 Ø, entonces 
por un argumento similar al que usamos para mostrar que W es (T — Aidy)-invariante 
se tiene que cada vector de C; es la imagen bajo L de un vector de C;. Recíprocamente, si 
0% w € W es la imagen, bajo L, de un vector v; € Ci, como L = (T — Aidy), entonces 


w = L(v;) = (T — Midy)o; = (T — Aidy )(T — A idy)” "v 
(ya que los vectores v; de C; son vectores propios generalizados, i.e., son de la forma 


(T — Aidy)”:=*v). Ahora, como p; — k+ 1 > 1, entonces w = (T — Aidy)» ttiv € C; 
no puede ser el vector final v del ciclo; más áun, w 4 0 por hipótesis, y así w € C;. 


6.2. LA FORMA CANÓNICA DE JORDAN. 159 


q 
Pongamos C’ := U C}. Por el párrafo anterior se tiene que C’ genera al subespacio 


i=1 
ImZ C W. Más aún, |C'| = |C| = n — q (ya que quitamos en cada C; un vector). 
Además, los vectores iniciales de los ciclos C/ también son vectores iniciales de los C;. 
Podemos entonces aplicar la hipótesis de inducción a C’ y concluir que C’ es linealmente 
independiente. Se sigue que C’ es base de Im L y por lo tanto dimp Im L = n — q. 

Por otra parte, como los q vectores iniciales de los ciclos C; son linealmente inde- 
pendientes por una hipótesis del teorema, y como además estos vectores iniciales son los 
(únicos) vectores propios de los ciclos C;, entonces cada uno de ellos está en ker(L) = 
ker(T — Aidy), por lo que dim xx ker(L) > q. 

De la igualdad dimw = dim ker L + dim x Im £ se sigue que 


n > dimx W = dim x ker L + dimxImL>q+(n-q)=n 


y por lo tanto todas estas desigualdades deben ser igualdades y así dimg W = n = 
dimx V y como C genera a W por definición de W y |C| = n, entonces C es linealmente 
independiente, como se quería. 


El resultado principal es: 


Teorema 6.21. Sea T : V — V un operador lineal en un K-espacio vectorial de dimen- 
sión finita n y sea A un valor propio de T. Entonces, K, (T) tiene una base dada por una 
unión de ciclos disjuntos de vectores propios generalizados asociados a A. 


DEMOSTRACIÓN. Por inducción sobre m = dimx Kx(T). Sim = 1, Kx(T) = EXT) 
tiene dimensión 1 y no hay nada que probar. Asumamos que el resultado es válido siempre 
que dimx Kx(T) < m y supongamos que dimx Kx(T) = m. Consideremos la resticción 
L = (T—Aidy)|x, (r) y Su imagen Im L € Kx(T). Note que (T — A idy) no es inyectiva 
porque existen vectores propios distintos de cero en K1(T'); se sigue que (T — Aidy) 
tampoco es suprayectiva y por lo tanto dim x Im L < dimx K1x(T). Observe que Im L = 
K, (Tim L). Podemos entonces aplicar la hipótesis de inducción a Im L y así existen ciclos 
disjuntos de vectores propios generalizados de T|ım z ( y por lo tanto de T), digamos 
C1,...,Cx, tales que C’ = Cı U --- U Cp es una base de Im L. Para cada 1,1 < i < k, 
el vector final del ciclo C; es la imagen, bajo L, de un vector v; € K) (T) y así, podemos 
extender cada C; al ciclo = C; U {v;i} de vectores propios generalizados de T. Para 
cada i sea w; el vector inicial de C (y por lo tanto de C;). Como {w1,..., Wp} es un 
subconjunto linealmente independiente de Ex(T') (ya que los vectores iniciales de cada 
ciclo son vectores propios), entonces podemos extender este conjunto a una base de Ex (T), 
digamos (1, . . . , Wk, U1,» - - , Us). Considerando cada {u;} como un ciclo, se tiene que 


Cuesta dura) 
son ciclos disjuntos de vectores propios generalizados de T tales que los vectores iniciales 
son linealmente independientes. Por el teorema anterior su unión C es un subconjunto 
linealmente independiente de K,(T”). Probaremos que es una base. En efecto, si |C| = 
dim x Im L =: r, como |C,| = |C;| + 1, entonces 
[C| = |C] + + Ck] + Aur t Husy =|Cl+9+1+--+1=r+q+s. 
S 


Más aún, como ([w,,...,wz,uz,...,us) es base de E,(T) = ker L, entonces la 
dimensión de ker L es k + s, por lo que 


dimx Kx(T) = dim x Im L + dimy ker L = r + k + s = |Cl 
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y así || = dimx Kx(T), con C linealmente independiente y por lo tanto C debe ser una 
base de K,(T”), como se quería. 


6.3. La forma canónica racional 


Hasta ahora hemos usado valores propios, vectores propios y vectores propios gene- 
ralizados, para analizar operadores lineales cuyo polinomio característico se descompone 
en factores lineales. Por otra parte, sabemos que, en general, todo polinomio no constante 
f(t) € K[t] se descompone, en forma esencialmente única, en factores irreducibles en 
Kft]: 

(+) FE) =pu(0"" o pe (E) 
con los p; (t) polinomios irreducibles en K[|t] y m; > 1 enteros. Ahora, si T : V — V es 


un operador lineal en un K-espacio vectorial de dimensión finita n, entonces su polinomio 
característico es de la forma 


r(t) = (2D + an 1877 +--+ art + ao € Klt] 
y así su factorización (*) la podemos escribir como 
pr(t) = "ot e pe 
con los ġ;(t) polinomios mónicos irreducibles distintos en K [t] y los m; > 1 enteros. 
Cuando ġr(t) se descompone en factores lineales en K[t] los ġ;(t) son de grado 1 y 
mónicos, i.e., son de la forma /,(t) = t — A; con A; € K un valor propio de T. Así, hay 


una biyección entre los valores propios de T y los factores mónicos de r(t). Ahora, el 
hecho de que un polinomio se descomponga depende no sólo del polinomio sino también 


i a € Mat 2 x 2(R) cuyo polinomio 
característico es P1(t) = t? + 1 € R[t] muestra que, en general, puede suceder que A no 


tenga ningún valor propio en K, R en este caso. Otro ejemplo es 


del campo K en cuestión. El ejemplo A = ( 


0 —1 0 0 
1 0 00 

A= 0 0 0 2 € Mataxa(Q) 
0 0 1 0 


cuyo polinomio característico es 
2 2 
palt) = (19 +1) — 2) € Ql] 
y cuya factorización en polinomios irreducibles es precisamente la anterior, también mues- 


tra que no tiene valores propios en Q. Sin embargo, viendo a la matriz con entradas en R 
(ya que Q C R), su polinomio característico se factoriza como 


palt) = (P + DP — 2) = (P +1) - v2)(t + v2) € R[t] 


y así A tiene dos valores propios en R. Más aún, viendo a A con entradas en C (ya que 
Q C R C C), su polinomio característico se factoriza en C[t] como 


dalt) = (t -D+ Hl- VAt + 2) e Ci] 


por lo que tiene todas sus raíces en C. 

Los ejemplos anteriores muestran que no siempre se tienen los valores propios de un 
operador T en el campo K correspondiente; sin embargo siempre se tiene la factorización 
de ¿p(t) en polinomios irreducibles mónicos ġ;(t) de K [t] y en esa sección obtendremos 
algunos teoremas sobre la estructura del operador T basados en los factores irreducibles 
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6s(t) de r(t) en lugar de usar sus valores propios. La definición siguiente recoge lo 
salvable para poder generalizar las nociones de espacios propios y espacios propios gene- 
ralizados: 


Definición 6.22. 


EJERCICIO 1. Si T : V — V es un operador lineal en un K-espacio vectorial de dimensión 
finita y si T es triangulable, demuestre que T' es un isomorfismo si y sólo si todas las 
entradas en diagonal de la matriz triangular superior correspondiente son distintas de cero. 


EJERCICIO 2. Si T : V — V es un operador lineal en un X-espacio vectorial de dimensión 
finita y existe una base de V tal que la matriz asociada a T' con respecto a esta base es 
triangular inferior, 1.e., todas las entradas arriba de la diagonal principal son cero, ¿será T' 
triangulable (superiormente)? 


EJERCICIO 3. Si T : V — V es un operador lineal en un X-espacio vectorial de dimensión 
finita y T es triangulable, ¿cuáles son valores propios de T? 


EJERCICIO 4. Sea T : V — V un operador lineal nilpotente en un X-espacio vectorial de 
dimensión finita n y supongamos que todos los valores propios de T están en K. Demuestre 
que T es triangulable. ¿Cuáles son los valores propios de un operador nilpotente? 


EJERCICIO 5. Sea T : V — V un operador lineal nilpotente en un X-espacio vectorial 
de dimensión finita n. Demuestre que existe un operador lineal L : V — V tal que L? = 
idy +T. 


EJERCICIO 6. Sea T : V — V un operador lineal nilpotente en un K-espacio vectorial de 
dimensión finita n y sea k > 0 el menor entero positivo tal que T! = 0. Para un subespacio 
vectorial W C V defina 


TÍW := {Tw : weW)=Im7T7, 
para j > 0 entero. Demuestre que el subespacio 
W +TW +T?°W +- +T* W CV 
es T-invariante. 


EJERCICIO 7. Sean L, T : V — V operadores lineales tales que L o T es nilpotente. 
Demuestre que T o L también es nilpotente. 


EJERCICIO 8. Sea T : V — V un operador lineal idempotente, i.e., T? = T. Demuestre 
que V = ker T 9 ImT. 


EJERCICIO 9. Sea T : V — V un operador lineal arbitrario en un K-espacio vectorial de 
dimensión finita n. ¿Será cierto que V = ker T Im T? Si lo es, demuéstrelo; si no lo es, 
dé un contraejemplo. 


EJERCICIO 10. Sea T : C? — C? dado por T (w, z) = (z, 0). Encuentre todos los vectores 
propios generalizados de T. 


EJERCICIO 11. Sea T : C? — C? dado por T(w,z) = (—z, w). Encuentre todos los 
vectores propios generalizados de T. 
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EJERCICIO 12. Sea V un C-espacio vectorial de dimensión finita n y sea T : V — V un 
operador lineal. Demuestre que V tiene una base de vectores propios de T si y sólo si todo 
vector propio generalizado de T es, de hecho, un vector propio de T. 


EJERCICIO 13. Sea T : V — V un operador lineal y sea A un valor propio de T. Demuestre 
que ker(T — Aidy)* = ker(Aidy —T)", para todo k > 1. 


EJERCICIO 14. Sea T : V — V un operador lineal en un K-espacio vectorial de dimensión 
finita n y sea À un valor propio de T. Si B es una base de Jordan de T, demuestre que 
B' = B N K, (T) es base de Kx(T). 


EJERCICIO 15. Sea T : V — V un operador lineal nilpotente en un C-espacio vectorial 
de dimensión finita n. Demuestre que T se puede escribir como T = D + N, donde D es 
un operador diagonalizable, N es un operador nilpotente y DN = ND. 


EJERCICIO 16. Con las mismas hipótesis que el ejercicio anterior y suponiendo además 
que V es T'-cíclico, demuestre que: 


(1) T tiene un único valor propio A. 
GD Ex(T) es de dimensión 1. 


EJERCICIO 17. Con las mismas hipótesis del ejercicio 12 y suponiendo además que T es 
nilpotente y no cero, demuestre que T no es diagonalizable. 


EJERCICIO 18. Sea D : P3(C) — P3(C) el operador derivación. 


(i) Calcule [D]e para la base canónica 1, z, 2?, 2? de P3(C). 
(11) Encuentre la forma canónica de Jordan de esta matriz. 


EJERCICIO 19. Para cada uno de los operadores lineales siguientes, encuentre una base 
para cada espacio propio generalizado, de tal manera que la base sea una unión de ciclos 
disjuntos de vectores propios generalizados: 


G) A: R? — R? dado por A = ( 1 3 


=f 3 
11 -4 -5 
Gd) A= |21 -8 -11 
3 -1 0 


Gii) T : Pa(R) — Pa(R) dado por T( f) = 2f — f’. 


EJERCICIO 20. Encuentre la forma canónica de Jordan de cada operador el ejercicio ante- 
rior. 


Capítulo 7 


Espacios con producto interno 


ASTA AHORA HEMOS ESTUDIADO ESPACIOS vectoriales en general, habiendo abs- 
traído las propiedades de los espacios R”. En este proceso de abstracción hemos 
ignorado ciertas propiedades de R”, en particular de R? y R, relacionadas con el concep- 
to de medición tales como las nociones de longitud, área, volumen y ángulos, es decir, de 
ciertas propiedades de los vectores de R” importantes en contexto de medir. Por ejemplo, 
en R?, si visualizamos sus vectores como segmentos de recta dirigidos o flechas basados 
en el origen: 


observando esta figura vemos que se tiene un triángulo rectángulo con hipotenusa el vector 
v y catetos sus componentes x, y. Para ser precisos, su hipotenusa en realidad es lo que 
intuitivamente pensaremos como la longitud del vector v, a la que denotaremos por |lv|| y 
a la que llamaremos la norma del vector v. Del teorema de Pitágoras se sigue que ||v||? = 


x£? + y?, por lo que 
loll = yx? + y?. 


Similarmente, para vectores en R3, digamos v = (x,y, z): 


por un razonamiento análogo se tiene que la norma del vector v está dada por 


lol = VA FFA. 


Esto se puede generalizar a vectores v € R”, digamos v = (11,12,..., Tp) para 
definir su norma como: 


loll = y2? +23 +--- +22. 

Resulta que la norma es una función || || : R” — R y el lector puede verificar fácil- 
mente que no es una función lineal. El objetivo es entonces tratar de obtener la norma 
de un vector v usando funciones lineales y para ésto, en primer lugar hay que ver a la 
norma de v como una función de las n componentes x; de v y luego se introduce el pro- 
ducto punto de vectores de R” usando estas componentes, mediante la regla siguiente. Si 
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v = (£1,..., £n) y W = (y1,...,Yn) son dos vectores de R”, su producto punto es el 
escalar 

V- W := 1141 + T2Y2 +: + InYn ER. 
Enfatizamos que el producto punto de dos vectores de R” es un escalar y no un vector. 
Observe que la norma de un vector v = (x1,...,t,) de R” está dada, en términos del 
producto punto mediante la fórmula 


lol? =v: v. 


7.1. Productos internos y hermitianos 


El producto punto de vectores de R” es una función R” x R” — R que satisface las 
propiedades de la definición siguiente, como el lector puede verificar fácilmente, y donde 
hemos incluido la conjugación compleja para el caso de espacios vectoriales sobre C. 


Definición 7.1. Denotemos con K al campo R ó al campo C, y sea V un K-espacio 
vectorial. Un producto interno en V es una función 


(,): Vx V >K 
que asigna a cada par ordenado de vectores (v, w) € V x V un escalar (v, w) € K que 
satisface las propiedades siguientes: 
(i) Es aditivo en la primera componente, i.e., 
(u +v, w) = (v, w) + w, w) 


para todo v, v”,w € V. 
(11) Es homogéneo en la primera componente, i.e., 


(Av, w) = Mo, w) 
para todo v,w EV yA € K. 
(iii) Es simétrico bajo conjugación, i.e., 
(v, w) = (w, v) 
para cualesquiera v, w € V y donde la barra denota la conjugación compleja. 
(v) Es positivo, i.e., 
(0, v) 20 
para todo v € V. 
(v) Es no degenerado, i.e., 
(vv) =03v=0. 
Recordemos que R C C y que un complejo A € C es real si y sólo si A = A. Así, 
si V es un R-espacio vectorial la propiedad (iii) nos dice que un producto interno real es 


simétrico: (v, w) = (w, v}. Se sigue que un producto interno real es aditivo y homogéneo 
en la segunda variable también. 


Ejemplo 1. Si V = R” y si v = (a1,..., an), w = (b,,...,b,) están en R”, la función 
dada por el producto punto: 


n 
(v, w) := v -w = aibi +- + anbn = X ajb; 
j=1 


es un producto interno en R”. En ocasiones diremos que el producto punto es el producto 
euclidiano usual de R”. Su generalización al C-espacio vectorial C” es obvia: 
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Ejemplo 2. Si V = C” y si v = (a1,...,an), w = (b1,...,b,) están en C”, la función 
dada por: 


n 
(v, w) = aıbı + seos + anbn = X ajb; 
j=1 
es un producto interno en C”, al que se suele llamar el producto hermitiano usual de C”. 
Un mismo espacio vectorial puede tener diferentes productos internos: 


Ejemplo 3. Si V = R” y si A1,...,An € R son reales positivos dados, para v = 
(a1,...,4p),w= (b1,...,b,) en R”, a función 


(v, w) := A1a1b1 +++ + Ananda = 5 Ajajb; 


j=1 


es un producto interno en R”. Note que si todos los escalares A; = 1 se recobra el producto 
punto usual de R”. Otro caso particular es cuando todos los A; = A > 0 son iguales a una 
constante positiva. En este caso se tiene que 


(v, w) = Av - w) 


donde en la derecha se tiene al producto euclidiano usual. 


Ejemplo 4. Si V = P„(R) es el R-espacio vectorial de los polinomios con coeficientes 
reales y de grado < n, la función 


(, ) : Pa(R) x Pah (R) >R 
dada, para p(x), q(x) € P„(R), por la integral definida: 


ds I OLOLA 


es un producto interno en P„(R). El único axioma que puede dar un poco de dificultad 
es el (v), pero en este caso notamos que si p(x) = q(x), entonces p(1)q(x) = p(x)? y si 
p(x) Æ 0, entonces existe un real a € [0, 1] tal que p(a) 4 0 y así p(a)? > 0. Ahora, como 
p(x) es una función continua en [0, 1], existe una vecindad de « tal que p(a)? > 0 en esa 
vecindad y por lo tanto, ya que p(x)? > 0 en todo [0, 1], se debe tener que e p(a)?dx > 0. 


Ejemplo 5. Si V = Mataxn(R), la función ( , ) — R dada por 
(A, B) := Tr(A4'B), 


donde *B es la transpuesta de B, es un producto interno en V. Los axiomas (i) y (11) son 
fáciles de verificar. Para (111) se tiene que 


(B, A) =Tr(B*A) por definición 
= Tr(*(B*A)) porque Tr(*M) = Tr(M) 
= Tr(4'B) porque *(MN) =*N'M y*('A)) =A 
= (A, B). 
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Para (iv) y (v), si 4% 0 y si A = (a;;), entonces *A = (aji) y así 


Q11 Q12 :*:: ln 011 Q21 *** Qni 
a Q21 Q22 :*:: 0Q2n Q12 Q22 **: Ama 

A CA=| . =: (big) 
an1 An2 ünn Qin 02n Ann 


y por lo tanto 


i=1 k=1 
por lo que Tr( AtA) > 0 yes > 0si A 20 0 e que entonces algún a; 4 0). 
Note que las propiedades (i) y (ii) de un producto interno nos dicen que la función 


( , ) es lineal en la primera variable. Las primeras dos partes del teorema siguiente nos 
dicen que la función ( , ) casi es lineal en la segunda variable (de hecho, lo es si K = R): 


Teorema 7.2. Sea V un K-espacio vectorial con producto interno ( , ). Si u,v,w € V y 
si AE K, entonces 


(1) (u,v + w) = (u,v) + (u, w). Es decir, ( , ) es aditiva en la segunda variable. 


(2) (u, Av) = Alu,v). Es decir, | , ) saca escalares en la segunda variable, pero los 
conjuga. 


(3) (0,v) = 0 y, consecuentemente, (v,0) = 0 también. 
(4) Si (u, v) = 0 para toda v, entonces u = 0. 
DEMOSTRACIÓN. Para (1): 


(u,v + w) =(v+w,u) porel axioma (iii) 


v,u) + (w,u) por (1) 


= (u,v) + (u,w) por (ii). 


Para (2): 


(u, Av) = (Av, u) porel axioma (iii) 


= Xu, u) por (ii) 


= Alu, u) 
Alu,v) por Gii). 


La parte (3) se sigue por linealidad en la primera variable. Para (4), como 0 = (u, v) 
para toda v, en particular para v = u se tiene que 0 = (u, u) y así, por el axioma (v) se 
sigue que u = 0. 


EJERCICIO 1. Si (u, v) = (u, w) para todo u € V, demuestre que v = w. 
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7.2. Normas 


Como indicamos al principio del capítulo, la noción de norma o longitud de un vector 
está implícita en el concepto de producto interno. 


Definición 7.3. Sea V un K-espacio vectorial con producto interno. Si v € V, su norma, 


denotada ||v||, es el escalar ||v|| := y (v, v). 


Ejemplo 6. La norma euclidiana de R” es la norma dada por el producto punto de R”, es 
decir, si v = (a1, . . . , an) € R”, su norma es: 


lell = yai ++ + ag. 


Note que si n = 1 se recupera el valor absoluto usual de R, i.e., ||v|| = |v| si v € R. 


Ejemplo 7. Si V = C” tiene el producto hermitiano usual, la norma de un vector v = 
(@1,...,@n) E C” está dada por 


lvl] = Varai + + + anan = Vlo? ++ fanl, 
donde |a&;| es el módulo del complejo a. 


Ejemplo 8. Si P,, (R) tiene el producto interno del ejemplo 4 y si p(x) € P,, (R), su norma 
es 


lp(æ)l] = f p(2)?dz. 


Las propiedades siguientes son inmediatas de las propiedades correspondientes de un 
producto interno: 


Teorema 7.4. Sea V un K-espacio vectorial con producto interno. Para todo v € V y 
à € K se satisface: 


(1) lol > 0y ||v]| = 0 si y sólo si v = 0. 
Q) Ao] = Allo 
K=C. 


, donde |A| es el valor absoluto de A si K = R y es el módulo de A si 


DEMOSTRACIÓN. (1): Como ||v|| = +y v, v} > 0, entonces ||v|| > 0 para todo v. Es 
claro que si v = 0 se tiene que ||0| = ,/(0, 0) = 0 y si ||v|| = 0, entonces (v, v} = 0 y por 
la definición 7.1 (v) se sigue que v = 0. 


Para (2), 
Ao? = (Av, Av) por definición de norma 
= Xu, Av) 
= AMu,v) por 7.2 (2) 
= |All 


de donde sacando raíces cuadradas se sigue el resultado deseado. 


Ortogonalidad. En R? con el producto punto usual, si u = (a, b) y si v = (—b, a): 
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es fácil probar que u y v, vistos como segmentos de recta dirigidos, son geométricamente 
perpendiculares. Observe que en este caso se tiene que 


u-v= (a,b) - (—b,a) = —ab+ ab = 0. 


Se puede probar también que, si u-v = 0, entonces u y v son perpendiculares. Esto motiva 
la definición siguiente: 


Definición 7.5. Si V es un K-espacio vectorial con producto interno, diremos que dos 
vectores u,v € V son ortogonales o perpendiculares, denotado u L v, si (u, v) = 0. 


Observaciones. (1). Si u L v, entonces v L u ya que (u,v) = 0 implica que (v, u) = 
(u,v) =0=0. 


(2). El vector Oy € V es ortogonal a cualquier otro vector v € V ya que (0y, v) = 0. 
(3). El vector Oy € V es el único vector que es ortogonal a sí mismo ya que (u, u) = 0 => 


u = Qy. 


El teorema siguiente toma su nombre del caso V = R? con el producto interno eucli- 
diano. 


Teorema 7.6 (Pitágoras). Si V es un K-espacio vectorial con producto interno y si u,v € 
V son ortogonales, entonces 


[lu + o]? = [lu]? + lol’. 
DEMOSTRACIÓN. 
[lu + o/1? = (u +, u +v) 


= (u, u) + (u,v) + (w, u) + w, v) 


= llull? +0+0+ lvl? ya que (u, v) = 0 = (v, u) 
|’. 


= lul? + llv 


Las desigualdades de Cauchy- Schwarz y del triángulo. Estas son dos de las desigual- 
dades más importantes en matemáticas y son válidas en cualquier espacio vectorial con 
producto interno. Para obtener estas desigualdades usaremos el resultado genérico siguien- 
te: supongamos que u,v € V son dos vectores con uno de ellos, digamos v, distinto de 
cero; si quisiéramos escribir al vector u € V como combinación lineal de un múltiplo 
escalar de v y un vector w ortogonal a v, es decir, si quisiéramos escribir a u como en la 
figura siguiente: 
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u 


entonces el vector w que buscamos debe satisfacer la igualdad u = Av + w, i.e., 
(1) w = u — Av 


y además debe ser ortogonal a v, es decir, debe satisfacer la igualdad (w, v} = 0, i.e., 
(u — Av, v) = 0. Desarrollando el lado izquierdo obtenemos 


(u,v) — Alv, v) = 0 


y así Aļ||v||? = (u, v) y como v Æ Ov, entonces ||v|| 4 O por lo que podemos despejar el 
escalar A de la igualdad anterior: 


(2) à= 


Hemos así probado que si v 4 Oy, entonces para cualquier vector u € V existe un 
escalar À tal que u — Av L v. Note que con este escalar A el vector w de la ecuación (1) 
queda 


(3) w = u — + 


El escalar A así obtenido se llama la componente de u a lo largo de v y se denota 
A = comp, (u). 
El vector Av se llama la proyección de u a lo largo de v y se denota 
Av = proy, (u). 
Teorema 7.7 (Desigualdad de Cauchy- Schwarz.). Si V es un K-espacio vectorial con 
producto interno y si u,v € V, entonces 


(u,v) < lullllv!!. 


DEMOSTRACIÓN. Si v = 0 ambos lados de la desigualdad son cero y así no hay nada que 

= (u,v) cía 
probar. Supongamos entonces que v Æ 0. Para w = u — Jo? V> Como en la ecuación (3) 
de la discusión previa al teorema, se tiene que w L v y 


u= v +w 


lvl]? 
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(u,v 


con w L uE v y así, por el teorema de Pitágoras 


jal? [o + lwl? 
f i I ol? + at? 
= uÉ + op 
> Men yaque jw? >0. 


Multiplicando ambos lados de la desigualdad anterior por ||v||? y luego sacando raíz 
cuadrada el resultado se sigue. 


Ejemplo 9. Si V = R” con el producto punto usual y si u = (a,,...,an) y v = 
(b1,...,b,), la desigualdad de Cauchy- Schwarz es: 
1/2 1/2 
2 2 
abs (2 3] 125 
j=1 j=1 j=1 


Ésta es la fórmula que Cauchy probó en 1821. 


Ejemplo 10. Si V =C([0,1],R) y si f(x), g(x) e V, la desigualdad de Cauchy- Schwarz 


| <(/ ; jaa) (/ topar) 


Ésta es la fórmula que H. Schwarz probó en 1886. 


1/2 


/ ¡Oe 


La observación geométrica de que la longitud de un lado de un triángulo es menor que 
la suma de las longitudes de sus otros dos lados: 


u+ v 


u 


es el origen del teorema siguiente: 


Teorema 7.8 (Desigualdad del triángulo). Si V es un K-espacio vectorial con producto 
interno y si u,v € V, entonces 


lu + ol! < llull + [fol]. 
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DEMOSTRACIÓN. 
Ju + ul? = lu +v, u+ v) 
= (u, u) + (u,v) + (v, u) + (v, v) 
= [Jul]? + (u,v) + (u,v) + lloll? 
= |jul|? +2Re (u, v) + Iv]? 
(recordando que si z = x + iy € C, z + Z = 2Re (z)) 
< llull? +21(u, v)] + lloll? 
(ya que |z| > |x| > x, para z = x + iy € ©) 


all? + 2llulljlvl| + Ju]1? por la desigualdad de Cauchy- Schwarz 


= (llull + llel)’, 


y sacando raíz cuadrada se obtiene el resultado deseado. 


Ejemplo 11. Las desigualdades del triángulo correspondientes a los ejemplos 9 y 10 son: 


n n P 1/2 
PD < Es En 
j=1 j=1 j=1 


/ a ala) ae] e / Faye ¡e / i gla)de| 


EJERCICIO 1. En la desigualdad de Cauchy- Schwarz, demuestre que se tiene la igualdad 
si sólo si uno de los vectores es múltiplo escalar del otro. 


1/2 1/2 


+ 


1/2 


EJERCICIO 2. (Igualdad del paralelogramo). Si V es un espacio vectorial con producto 
interno y si u,v € V, demuestre que 


lu + vl? + lu — vll? = 2(llull? + lel?) 


e interprete geométricamente esta igualdad. 


7.3. Bases ortonormales 


Si V es un espacio vectorial con producto interno, un vector u € V se dice que es 
unitario si ||u|| = 1. Si v es cualquier vector no cero, multiplicando v por 1/||v|| se obtiene 
un vector unitario u = (1/||v||)v. Un conjunto de vectores u1,..., um de V se dice que 
es ortonormal si cada u; es unitario y si son ortogonales por pares, i.e., (u;, uj} = 0 para 


LA]. 
Ejemplo 12. En R” los vectores canónicos e,,... , €, son ortonormales. 


Nuestro objetivo ahora es mostrar que todo espacio vectorial de dimensión finita y con 
producto interno, tiene una base consistente de vectores ortonormales. Una de las ventajas 
de tener una base ortonormal en V es que es muy fácil expresar cada vector v € V como 
una combinación lineal de la base ortonormal, lo cual es el contenido del teorema siguiente: 
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Teorema 7.9. Sea V un espacio vectorial con producto interno y sea uz,... , Um Un con- 
junto ortonormal de V. Si v € V se escribe como v = au + *** + An Un, entonces 


aj = (v, uz), es decir, 
m 
v= S (0, u7)03. 


j=1 


DEMOSTRACIÓN. Calculando el producto interno de v con cada u; se tiene que 


m 


m 
(uv, uj) = (Y au) = S ai(ui, u) =4j, 
¡=1 


i=1 


ya que (u;, uj) = O si i # j y (uj, uj} = 1. 


Una consecuencia inmediata es: 


Corolario 7.10. Sea V un espacio vectorial con producto interno. Si u1,..., Um es un 
conjunto ortonormal de V, entonces es linealmente independiente. 


DEMOSTRACIÓN. Si a1u1 +: * ++ 47 Um = 0, entonces para v = 0, por el teorema anterior 
se tiene que aj = (0, uz) = 0. 


Los resultados anteriores nos muestran la importancia de tener una base ortonormal 
de V y el teorema siguiente nos dice cómo obtener una tal base para un espacio vectorial 
de dimensión finita y con un producto interno. El algoritmo que se usa en la construcción 
de una tal base ortonormal de V, a partir de una base cualquiera de V, se llama el proce- 
dimiento de Gram-Schmidt y la idea es la misma que usamos en los párrafos previos a la 
demostración de la desigualdad de Cauchy- Schwarz. La recordamos para ponerla en con- 
texto: dados dos vectores vı, v2 linealmente inpendientes (que son base de un subespacio 
vectorial W de V de dimensión 2), poniendo w1 := v1 y Wa := V2 — Avı = v2 — AW, 
para el escalar A dado por 

A (va, 101) 

[wi]? 
se tiene que wı L wa y además vz = wa + Aw;. Observe ahora que como vı = w, 
entonces v1, v2 E€ K(w1, w2) y por lo tanto w, y wz son una base de W consistente 
de vectores ortogonales. Finalmente, dividiéndolos entre su norma se obtiene una base 


ortonormal de W: A i 
ES a n Wr -y Uam E 
[w|] l[w2ll 
El método anterior se puede aplicar ahora a tres vectores v1, U2, v3 linealmente inde- 
pendientes y que son base de un subespacio W de V de dimensión 3. El método nos dice 


que pongamos w := vı y después se define 


= (v2, w1) 
Wa := Va — 2 w1 
[w| 
y finalmente 
(v3, w1) (v3, w2) 
w3 := V3 wa. 
[wil]? [w2]? 


Claramente v1, va, V3 son combinación lineal de w1, wa, w3 y así los vectores w1, wa, 
13 generan el mismo subespacio W. Por el paso anterior se tiene que wı L wa y sólo 
falta mostrar que 143 es ortogonal a los otros dos vectores. Esto lo haremos como el paso 
inductivo en el teorema siguiente: 
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Teorema 7.11 (Gram-Schmidt). Sea V un espacio vectorial con producto interno. Si 


U1,++.,Um son linealmente independientes, entonces existen vectores u;,..., Uy, orto- 
normales tales que uz,...,uj es una base del subespacio generado por V;,...,Ux, para 
k=1,...,m. 


DEMOSTRACIÓN. Por inducción sobre k, el caso k = 2 es el de las observaciones previas 
al teorema. Supongamos ahora que el teorema es válido para k— 1, i.e., que ya se eligieron 
vectores ortonormales u;,...,ux-—1 tales que 


K(u,...,44-1) = K(U1,...,Ur-1) 


y defínase 


UL := Up — Ayu — Agua — +++ — Ap 1U%-1 
para A; := (uz, uz) /l|uzl]?. Entonces, uz L uj, para j =1,...,k— 1, ya que 
(uk, uj) = (0%, uj) — A (u1, Ug) — A2(uz, Uj) — +++ — App (UR 1) Uy) 
= (Ur, Uj) — Aj(Uj, uj) ya que (u;, uj) = 0 para i # j 
= (vk, uj) — ei 3,9) por definición de A; 
Uj 
=0, yaque (uj, uy) = lluz!|?. 


Despejando a vz de la definición de uy vemos que vz es combinación lineal de u;,..., 
Uk—1, Uk y así 


K(v1,...,Uk—1, Uk) = K(u, ... , Up—1) Up) € K(us, .. .,Uk—1; Uk) 
y como uz es combinación lineal, por definición, de vk y u1, ..., Uk—1, Se tiene la igualdad 
en la inclusión anterior. Finalmente, se normalizan los vectores u;,...,uz dividiéndolos 


entre su norma. 


Corolario 7.12. Si V es un espacio vectorial de dimensión finita y con un producto interno, 
entonces V tiene una base ortonormal. 


DEMOSTRACIÓN. Por hipótesis existe una base v1,...,Uy de V, la cual se ortonormaliza 
usando el algoritmo del teorema anterior. 


Si V es un espacio vectorial con producto interno y B C V es un subconjunto orto- 
normal, dado v € V los escalares (v, u), con u € B se llaman los coeficientes de Fourier 
de v relativos a B. El nombre proviene del ejemplo siguiente: 


Ejemplo 13. Sea V = C([0, 27], C) el conjunto de funciones complejas continuas en el 
intervalo [0, 27]. Recuerde que, para t € [0,27], f(t) € C se puede escribir de la forma 


FE) = u(t) + iv(t) 
con u,v : [0,27] — R funciones reales. La función f es continua si y sólo si u y v 


son funciones continuas. Con la suma y productos de C, V = C([0, 27], C) resulta un 
C-espacio vectorial. En V se tiene el producto interior dado por 


1 277 a 
== t)g(t)dt 
=z [1090 
donde la integral de una función compleja ¢ : [0,27] — C, p(t) = u(t) + iv(t), está dada 


mediante 
277 


o(t)dt := f Í u(t)dt + if í v(t)dt. 


0 
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Sea W el subespacio de V generado por las funciones 
ex(t) :=e* conkeZ,0<t<2rei=y-1, 


entonces las funciones ex(t) son ortonormales ya que, si k Æ £: 


Ie tt ol L Sa 1 1 i Zn 
e S ¿kt ¿—itt q = — (Lt qt A i(k—£)t =0 
(er, ee) a m Al á 277 AC 0 ; 


y sik=f, 
1 27 ikt ki 1 277 1 
== Med = — dt = — (27) = 
(ex, €x) 27 | ds 27 Jo zz. m 
Ahora, si f(t) € C([0, 27], C), su coeficiente de Fourier con respecto a ex es: 


1 2m . 
Mi= (Le) => feed 
0 


y el lector verá en sus cursos de análisis el origen de estos coeficientes. 


Ejemplo 14. Si V es el subespacio de Rt generado por los vectores 
vı = (1,1,0,1), vz = (1, —2, 0,0), v3 = (1,0, —1,2), 


es fácil ver que estos vectores son linealmente independientes y para hallar una base orto- 
normal de V a partir de ellos, usando el algoritmo de Gram-Schmidt, procedemos como 


sigue: 
Sea u1 := vı = (1,1,0,1). Después, pongamos 
(va, u1) 1-2+0+0 4 5 
S = (1, —2,0,0 1,1,0,0 = (5- ,0,0) 
A a AA 
Finalmente, 
uz := 03 (v3, u1) (us, 2) ,,, 
ull? llull? 
1+0+0+2 S+0+0+0/4 5 
= (1,0, -1,2) 5 —(1,1,0,1) - 22 (5)-3:0,0) 


9 
12/4 5 
= (1,0,—1,2) — 1(1,1 D-5- ) 
( ,0, ? ) ( ? , 0, ) 41 3? 30,0 
16 37 
a e 1). 
( 41 41% *” 
Para terminar se dividen entre sus normas para hacerlos unitarios. 


Proyecciones ortogonales. Si V es un espacio vectorial con producto interno y W C V 
es un subespacio vectorial, consideremos el conjunto 


W:=f[vE€eV : vlw para todo w EW}. 
Lema 7.13. W+ es un subespacio vectorial de V. 


DEMOSTRACIÓN. 0 € W- ya que (0, w) = 0 para todo w € W. Ahora, si v, v’ € WF, 
entonces para todo w € W se tiene que 

(w+ w) = (0,00) + (0,0) =0+0=0 
y así v +v’ € WŁ. Finalmente, si A € K y v € WŁ, entonces para todo w € W se tiene 


que 
(Av, w) = Aw, w) =A-0=0 
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y así Av € WŁ. 


A WŁ se le conoce como el complemento ortogonal de W en V. Las propiedades 
siguientes son inmediatas y se deja como un ejercicio el probarlas: 


a) V+ =0. 
2) 0t =V. 
(3) Wi C W2 C V implica que Wg J WŁ. 


Teorema 7.14. Sea V un espacio vectorial de dimensión finita y con un producto interno. 
Sea W C V un subespacio vectorial y sea W+ el complemento ortogonal correspondiente. 
Entonces, V = W 9 W+. 


DEMOSTRACIÓN. Si W = 0, entonces W+ = V y no hay nada que probar. Similarmente, 
si W = V, entonces WŁ = 0 y tampoco hay algo que probar. Supongamos ahora que 
0 S W S V y sea {w1,..., wr} una base ortonormal de W. Por el algoritmo de Gram- 
Schmidt existen vectores ur+1,-- -, Un de V tales que {w1,... , Wr, Ur+1,-: +, Un } es una 
base ortonormal de V. Claramente los uj € W- ya que son ortogonales a los w; porque 
forman parte de la base ortonormal de V; por linealidad se sigue que son ortogonales a 
todos los vectores de W y por lo tanto los u; € W+. Mostraremos que [u,+1,..., Un} es 
una base ortonormal de W+. Para comenzar, son linealmente independientes ya que son 
un subconjunto de una base de V. Para ver que generan, sea u € W+ un vector cualquiera. 
Pensando a u como vector de V, existen escalares A; tales que 


(x) u = Wi +- H Arwr + Ary 1841 + 00 Anun 


y como u € W+, entonces, para 1 < j < r, los coeficientes A; = (u, w,) = 0 ya que los 
wj € W. Por lo tanto la igualdad (+) es de la forma 


u= Ar+1Ur+1 TEREE An Un 


y consecuentemente [u,+1,...,Un ) genera a WŁ. 


Un teorema de Schur. El algoritmo de Gram-Schmidt tiene una aplicación importante a 
la teoría de operadores lineales: 


Teorema 7.15. Sea T : V — V un operador lineal en un espacio vectorial de dimensión 
finita con producto interno. Si T es triangulable, entonces T es triangulable con respecto 
a una base ortonormal de V. 


DEMOSTRACIÓN. Sea B = {v1,.. . , Un } una base de V tal que [T]g es triangular superior. 
Por 6.1 cada subespacio K(v1,...,vx) es T-invariante para k = 1,...,n. Aplicando el al- 
goritmo de Gram-Schmidt a v1, . . . , Un se obtiene una base ortonormal U = [uz,...,un) 


de V y por el teorema de Gram-Schmidt 
K(ui,... uk) = Klv1,...,0x), parak = 1,...,n, 


por lo que K(u1,..., ug) es T-invariante para cada k y consecuentemente |T]ų es trian- 
gular superior por 6.1. 


Corolario 7.16 (Schur). Sea T : V — V un operador lineal en un espacio vectorial 
de dimensión finita con producto interno. Supongamos que el polinomio característico de 
T se descompone en K. Entonces, existe una base ortonormal U de V tal que |T]uų es 
triangular superior. 
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DEMOSTRACIÓN. Por 6.2, T es triangulable y así el corolario se sigue del teorema previo. 


EJERCICIO X. Demuestre las tres afirmaciones que se hicieron después de la definición de 
complemento ortogonal. 


Capítulo $ 


Los teoremas espectrales 


ABEMOS, POR 5.1%, QUE UN OPERADOR LINEAL T : V — V en un K-espacio vec- 
S torial de dimensión finita, es diagonalizable si y sólo si el espacio V tiene una base 
de vectores propios de T. Ahora, si K = R ó C y si V tiene además un producto interno, 
es natural preguntarnos si V tiene una base ortonormal de vectores propios de T. En es- 
te capítulo retomamos el estudio de operadores lineales añadiendo la condición de que el 
espacio considerado tenga un producto interno y la respuesta a la pregunta anterior la dan 
los teoremas espectrales, uno para el caso complejo y otro para el caso real. La generali- 
zación de estos teoremas espectrales al caso infinito es de gran importancia en el análisis 
matemático. 


8.1. La adjunta de una transformación lineal 


Si V es un K-espacio vectorial, como el campo K mismo también es un K-espacio 
vectorial, podemos considerar transformaciones lineales f : V — K a las que por su 
naturaleza especial se les suele distinguir llamándolas funcionales lineales. 


Ejemplo 1. La función f : P, (R) — R dada por f(p(x)) := J p(x)dz es una funcional 
lineal. 


Ejemplo 2. La función g : R? — R dada por g(a, b) := 3a + 2b es una funcional lineal. 


Ejemplo 3. Si V es cualquier K-espacio vectorial con producto interno ( , ) y v € V es un 
vector fijo, la función y : V — K dada por (u) := (u, v) es una funcional lineal ya que 
$ = ( ,v) es lineal en la primera variable. 


El teorema siguiente nos dice que todas las funcionales lineales en un espacio con 
producto interno y de dimensión finita, son de la forma del ejemplo 3. 


Teorema 8.1. Sea V un K-espacio vectorial de dimensión finita con producto interno y 
sea p : V — K una funcional lineal. Entonces, existe un único vector v € V tal que 
p(u) = (u,v), para todo u € V. 


DEMOSTRACIÓN. (Existencia del vector v). Sea u1,...,Uuy una base ortonormal de V. 
Por 7.9, para cualquier u € V se tiene que 


u = (u,u1)u +: + (U, Un) Un 
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y así 
plu) = 6 ((u, u)u +-+: + (u, Un) Un) 
= (u, u1)p(u) +++ + (u, Un) (Un) 
= (u, P(us)ur +-+ + (Un)Un) 
(porque (u, Aw) = A(u, w)) 


> (u, v) 


para v := ġ(u1)u1 +- + P(Un)Un 
(Unicidad del vector v). Supongamos que el vector v’ € V también satisface que ọ(u) = 
(u, v”) para todo u € V. Entonces, 


0 = ¢(u) — ġ(u) = (u,v) — (u, v’) = (u,v — v’) 


para todo u € V; por 7.2 se sigue que v — v’ = 0, i.e., v = v’, como se quería. 


Note la fuerza del teorema anterior que nos dice que toda funcional lineal, en un es- 
pacio de dimensión finita y con producto interno, está dada por el producto interno con un 
cierto vector v € V que depende sólo de la funcional lineal dada. La fuerza del teorema se 
puede apreciar en el ejemplo siguiente: 


Ejemplo 4. La función $ : P4(R) — R dada por 


o(p(x)) =j p(x) cos zdz 


es una funcional lineal y el espacio vectorial P4(R) tiene el producto interno 


(p,q) =/ plx)q(z)dz. 


Así, el teorema anterior nos dice que, para la funcional lineal ¢, existe un polinomio q(x) € 
P,¿(R) tal que 
1 


d(a) = : p(z) cos zdz = (p, q) = f p(z)gla)da. 


Note que q(x) es un polinomio (de grado < 4) por lo que el factor cos x de la definición 
de ¢ no sirve. 


La adjunta de una transformación lineal. Supongamos que V y W son dos espacios vec- 
toriales de dimensión finita y con producto interno y sea T : V — W una transformación 
lineal. Sea w € W cualquier vector y consideremos la funcional lineal 

Pu : V — K dada, para v € V, mediante Hyw(v) := (Tv, w) 


(observando que Tv € W y usando el producto interno de W). 
Por el teorema anterior, para la funcional lineal f., : V — K, existe un único vector 
en V, al que denotaremos T'*w € V, tal que 


Pwlv) = (v, Tw), 
es decir, tal que 
(Tv, w) = (v, T*w) 
para todo v € V. La existencia y unicidad del vector T*w € V define una función 
T*:W>V 
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y es fácil ver que T* es lineal. En efecto, si w, w’ € W, entonces 
(1) (Tv, w+ w’) = (Tv, w) + (Tv, w’) = (0, T*w) + (o, T* w) = (w, T*w+T*w”) 
y por otra parte 
(2) (Toyw +0) = (v, T*(w +), 
las igualdades (1) y (2) y la unicidad del teorema anterior implican que 
T*(w + w) = T*w + T*w. 
Finalmente, si w € W y A € K, entonces 
(Tv, Aw) = A(Tv, w) = Av, T*w) = (v, AT* w) 
y como (Tv, Aw) = (v, T*(Aw)), la dos igualdades anteriores implican que 
T* (Aw) = AT* (w) 
como se quería. 


Definición 8.2. La transformación lineal T* : W — V se llama la adjunta de la transfor- 
mación lineal T : V — W. La notación T* la leemos, algunas veces, como T-estrella. 


Con este lenguaje, lo que probamos arriba es: 


Teorema 8.3. Si T : V — W es una transformación lineal entre dos K-espacios vectoria- 
les de dimensión finita y con producto interno, entonces existe una única transformación 
lineal T* : W — V, la adjunta de T, tal que 


(x) (To, w) = (v, T*w) 
para todov € V yw € W. 


DEMOSTRACIÓN. Sólo falta verificar la unicidad de T* con la propiedad (x) requerida. 
Para ésto, supongamos que TË : W => V es otra transformación lineal tal que 


(To, w) = (v, Tw) 
para todo v € V y w € W. Entonces, 
lv, T*w) = (Tv, w) = (v, Tiw) 


para todo v € V y así, la unicidad del teorema 8.1 implica que T*w = T*w, para todo w 
y por lo tanto T* = TË. 


Ejemplo 5. Sea V = R” con el producto interno usual 


n 


(v, w) =v: w= S 0305, 


j=1 
y viendo a sus vectores como columnas. Sea A : R” — R” un operador lineal con matriz 
asociada A. Entonces, 


(Av, w) = (Av) -w= (A) -w=*w- Aw) = (v,*Aw) 


por lo que el adjunto del operador A es su transpuesta 4* =*4. 


El teorema siguiente recoge algunas de las propiedades importantes de la adjunta de 
una transformación lineal: 
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Teorema 8.4. Sean V y W dos K -espacios vectoriales de dimensión finita y con productos 
internos y sean L, T' : V — W dos transformaciones lineales. Entonces, 


d) (T+ D* = T* + I*. 
(2) (AT)* = AT*. 
Snte 


(4) SiM : W — U es otra transformación lineal, con U un K-espacio vectorial de 
dimensión finita con producto interno, entonces 


(M o T)* = T* o M*. 


(5) Siidy : V —> V es la transformación identidad, entonces 
(idy)* = idv. 

DEMOSTRACIÓN. Las partes (1), (2) y (5) las dejamos como un ejercicio. Para (4), si 
v E€ V y u E U, entonces 

(Mo T)v,u) =(M(Tv), u) = (Tv, M*u) = (v, T* o M*u) 
(la penúltima igualdad por definición de M* y la última igualdad por definición de T*) y 
así (M o T)* = T* o M*, por definición de adjunta. 

Para (3), si v € V y w € W, entonces 
(w, (T*)v) = (T*w,v) por definición de adjunta 


= (v, T*w) por propiedad del producto interno 


= (Tv, w) por definición de adjunta 


= (w, Tv) por propiedad del producto interno 


= (w, Tv) por doble conjugación. 


Se sigue que (w, (T*)*v) = (w, Tv) y por lo tanto T** = T. 


Teorema 8.5. Sean V y W dos K-espacios vectoriales de dimensión finita y con productos 
internos y sea T : V —= W una transformación lineal. Si A = {v1,..., Um} y B = 
{w1,... , Wn} son bases ortonormales de V y W, entonces, para la adjunta T* : W —> V 
se tiene que 

[T*]% = conjugada de la transpuesta de [T]8 


es decir, se conjugan cada una de las entradas de la matriz transpuesta de [T]5. 


DEMOSTRACIÓN. Debemos calcular cada T*w; y expresarlo en términos de la base vj. 
Ahora, como 

Tvuj = (Tos, w1)wi +-+: + (Tuj, Wn)Wwn 
entonces cada una de las entradas en el rengón j y columna ¿ de [T] es (Tv;, w,). Por otra 
parte, como 


T* w; = (T* wi, 01301 +: + (T* wi, Um)Um = (wi, Tv1)01 +++ + (wi, TUn)Umn 
entonces la entrada en el renglón ¿ y columna j de [T*] es 


(T* wj, vi) = (wj, Tvi) = (To;, wi) 
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y por lo tanto la entrada (+, j) de [T*] es la conjugada de la entrada (j,i) de [T], como se 
quería. 


Corolario 8.6. Si K = R, el teorema anterior nos dice que la matriz de T* es la trans- 
puesta de la matriz de T. 


El lector puede comparar el corolario anterior con el ejemplo 5. 


EJERCICIO X. Si V y W son dos K-espacios vectoriales de dimensión finita, con producto 
interno y si T : V — W es una transformación lineal, demuestre que: 
(1) ker T* = (ImD)-. 
(11) Im T* = (ker T)- 
Gii) ker T = (Im T*)-. 
(iv) ImT = (ker T*)- 


8.2. Operadores audoadjuntos y normales 


De nuevo, para enriquecer la teoría, nos restringiremos al estudio de transformaciones 
lineales de un espacio en sí mismo. Seguimos suponiendo que K = R ó C y que los 
espacios involucrados son de dimensión finita y con producto interno. 


Definición 8.7. Un operador lineal T : V — V se dice que es autoadjunto si T* = T. 

Por el último corolario, si K = R, un operador autoadjunto corresponde a una matriz 
simétrica (igual a su transpuesta). 
Ejemplo 6. Si T : V — V es cualquier operador lineal, el operador 

L := T*T — TT” 
es autoadjunto, ya que 
L* = (T*T — TT*Y* = (T*T)* — (TT*)* = T*T** — T*T = T*T — TT* = L. 

Lema 8.8. Sea T un operador lineal en un K-espacio vectorial de dimensión finita con 
producto interno. Si A es un valor propio de T, entonces A es un valor propio de T*. 


DEMOSTRACIÓN. Sea B una base ortonormal de V y sea A = [T] z. Si A es un valor propio 
de T, entonces det(A — Af,,) = 0 y por el ejercicio x se tiene que det(A — Af,)* = 0; 
pero por 8.4 se tiene que 


(A — Aln)" = A* — (A4)* = A* — Al, 
y por lo tanto det(4* — AIn) = 0 y así A es un valor propio de A*, i.e., de T*. 


Lema 8.9. Si T es un operador autoadjunto en un K-espacio vectorial de dimensión finita 
con producto interno, entonces todos los valores propios de T son reales. 


DEMOSTRACIÓN. Por supuesto que la afirmación sólo tiene interés cuando K = C. Sea 
pues A € C un valor propio de T y sea v % 0 un vector propio correspondiente a A. 
Entonces, Tv = Av y así 


Allvl? = A{v, v) = (Av, v) = (Tv, v) = (v, T*v) 
= (v,Tv) yaque T* =T 
= (v, Au) = A(v, v) = Allel? 
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y como ||v||? 4 0, la igualdad anterior implica que À = A, i.e., AER. 


Operadores normales. En el capítulo 5 vimos que un operador lineal T : V — V es 
diagonalizable si y sólo si el espacio V tiene una base de vectores propios de T. En el caso 
cuando V tiene además un producto interno, el teorema de Schur (7.16) nos dice que si 
todos los valores propios de T están en el campo K, entonces V tiene una base ortonormal 
B tal que [7] g es triangular superior. Si además queremos que [7] g se diagonal, entonces 
también [T*]g será diagonal ya que es la transpuesta conjugada de la matriz diagonal [7] y. 
Observamos ahora que, como las matrices diagonales conmutan, hemos así mostrado que 
si V tiene una base ortonormal B de vectores propios de T, entonces TT* = T*T. Vale la 
pena guardar esta igualdad: 


Definición 8.10. Si T es un operador lineal en un X-espacio vectorial V con producto 
interno, diremos que T es normal si TT* = T*T. 


Las observaciones previas nos dicen que si V posee una base ortonormal de vectores 
propios de T, entonces T es normal. En 8.14 probaremos la afirmación recíproca para 
el caso de C-espacios vectoriales, pero antes necesitaremos algunas propiedades de los 
operadores normales y unos ejemplos. 


Ejemplo 7. Todo operador autoadjunto es normal. 


Ejemplo 8. Si0 < 0 < m y Ro : R? — R? es la rotación por el ángulo 0, entonces en la 
base ortonormal canónica de R?, la matriz de Ry y la de su adjunta R¿ son: 


A= cosó —senĝ0 A= cosó sen 
— \senð  cosó y -~ A—senó cos 
por lo que AA* = In = A*A y así Ro es normal. 
Observe que Rọ no es autoadjunta, Note también que Rọ no tiene vectores propios 
(vea el ejemplo 4 del capítulo 5) y así el teorema 8.14 que probaremos para C-espacios 


vectoriales no es válido para R-espacios vectoriales, es decir, la normalidad de un operador 
lineal no es suficiente para que sea diagonalizable. 


Ejemplo 9. Si T : V — V es normal y A € K es cualquier escalar, entonces T — Aidy : 
V — V también es normal. En efecto, (T — Aidy)* = T* — Xidy y así 

(1) (T—Aidy)(T—Aidy)* =(T—Aidy)(T*—Aidy) = TT* — AT — AT* + Aà idv 
y. 
(2) (T—Aidy)*(T—Aidy) = (T* — Aidy )(T —Aidy) = T*T — AT* — AT +M idv 


y así, de (1) y (2), usando que T*T = TT*, se sigue que 
(T — idy )(T — Aidy)* = (T — Aidy)*(T — Aidy), 


i.e., (T — Aidy) es normal. 


El teorema siguiente da una caracterización sencilla de los operadores normales: 


Teorema 8.11. Sea T : V — V un operador lineal en un K-espacio vectorial con pro- 
ducto interno. Entonces, T es normal si y sólo si |[Tv|| = |[T*v!|, para todo v € V. 
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DEMOSTRACIÓN. Si T es normal, para cualquier v € V se tiene que 
|Tv]? = (Tv, Tv) 
v, T*Tv) por definición de adjunto 


v, TT* da porque T es normal 


= (o, 
= (o, 
= (o, 
=(T* 


v Ta por definición de adjunto de T* 
= ||T*v]?. 
Recíprocamente, si |Tv|| = ||T*v|| para todo v € V, entonces de las igualdades 


anteriores se tiene que 
(v, T*Tv) = (v,TT*v) para todo v € V 
y por lo tanto 
(v, (T*T — TT*\w} = 0 para todo v € V 
y consecuentemente (T*T — TT*)v = 0, para todo v € V, i.e., T*T — TT* = 


El lema 8.8 dice que los valores propios del adjunto T* de un operador lineal T son los 
conjugados de los valores propios de T, pero no dice nada acerca de los vectores propios 
ya que, en general, un operador T y su adjunto T* pueden tener vectores propios distintos. 
El corolario siguiente nos dice que, para operadores normales, el adjunto tiene los mismos 
vectores propios que el operador dado: 


Corolario 8.12. Sea T : V — V un operador normal en un K-espacio vectorial con 
producto interno. Si v € V es un vector propio de T' con valor propio A, entonces v es un 
vector propio de T* con valor propio A. 


DEMOSTRACIÓN. Como Tv = Av, entonces (T — Aidy)v = 0 y como T es normal, por 
el ejemplo 9 también T — Aidy es normal y así, por el teorema anterior, 


0 = ||(T - Aidy)o]| = (7 — Aidy)*v|| = ||(T* — Aidy)ol, 


i.e., (T* — Aidy w = 0 y por lo tanto v es vector propio de T* con valor propio A. 


Corolario 8.13. Sea T : V — V un operador normal en un K-espacio vectorial con 
producto interno. Entonces, vectores propios de T correspondientes a valores propios dis- 
tintos son ortogonales. 


DEMOSTRACIÓN. Sean v1, va vectores propios de T con valores propios A1 Æ Az. Por el 
corolario anterior, vı y va son vectores propios de T* con valores propios A1 y Aa y así 


(Ài — à2) (v1, v2) = Ar (v1, v2) — A2(U1, v2) 
= (A1U1, v2) z (v1, A2v2) 
= (Tv1, v2) — (v1, T* v2) 
= (vı, T* v2) — (v1, T* v2) 
=0 


y como Àı — A2 Æ 0, la igualdad anterior implica que (v1, v2} = 0, como se quería. 


EJERCICIO X. Sea K = R ó C. Si A € Matnxn( K), demuestre que det A* = det A. 
Sugerencia: A* = tA. 
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8.3. Los teoremas espectrales 


En la observaciones previas a la definición de operador normal, vimos que si V tiene 
una base ortonormal de vectores propios de T, entonces T es normal. Cuando K = C, la 
afirmación recíproca también es cierta: 


Teorema 8.14 (Teorema espectral complejo). Sea T : V — V un operador lineal en 
un C-espacio vectorial con producto interno. Entonces, V tiene una base ortonormal de 
vectores propios de T' si y sólo si T' es normal. 


DEMOSTRACIÓN. Sólo falta probar la suficiencia y para ésto, supongamos que T es nor- 
mal. Por el teorema fundamental del álgebra, el polinomio característico de T' se des- 
compone en factores lineales en C y así, por el teorema de Schur (7.16), existe una base 
ortonormal B = {v1,..., Un} de V tal que [T]g es triangular superior. Mostraremos que, 
de hecho, la matriz anterior es diagonal, y para ésto es suficiente mostrar que los vecto- 
res U1,...,Un de B son vectores propios de T. Para comenzar, como la matriz [7] g es 
triangular superior, i.e., es de la forma 


011 0412 `? Qin 
O az ::: 02 

[Tls = 
0 Ds 0 Ann 


entonces Tv, = a,1v1 y así vı es vector propio de T con valor propio a11. Ahora, como 
vı es unitario 


(1) [To]? = janv? = Jar11?l)01 117 = lar11?. 


Por otra parte, como la matriz asociada de T* es la transpuesta conjugada de [7] 5, entonces 
[T*]g es de la forma 


a11 0 De 0 
T 012 Q22  *** 0 
[T*] 5 = 
Alin A2 t: Ann 


y así, para el vector vı se tiene que 


E e a E 
Tv] = 41101 + 41202 + +++ + antn 


por lo que 
2 2 2 2 

(2) [To PP = lar" + Jarl" + -+ + larn] 
ya que v1, . . . , Un son ortonormales. 

Ahora, como T es normal, por 8.11 se tiene que ||Tv1|| = [[T7*v || y así, las igualdades 
(1) y (2) implican que a12 = +++ = 41n = 0, por lo que en el primer renglón de [T]g todas 
las entradas son cero, excepto a lo más por a11. 

Procediendo por inducción, supongamos que ya probamos que v1, . . . , Uk SON Vectores 


propios de T de tal forma que para la matriz [7] g en los primeros k renglones todas las 
entradas son cero excepto a lo más por a;i, para 1 < i < k. Consideremos ahora el renglón 
k + 1. De la forma que tiene la matriz se tiene que TV; +1 = Gk+1,+1Uk+1 ya que los 
coeficientes a; y +1 = 0 para 1 < 1 < k por hipótesis de inducción y también son cero para 
i > k + 1 porque [T]g es triangular superior. Se sigue que 


(3) Tuky]? = lag+1,%+11?. 
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Por otra parte, como [T'*] g es triangular inferior, se tiene que 
T* 0k41 = Qk+1,k+1Uk+1 + 0k41,k420%+2 + >: + 041. Un 


y por lo tanto 


(4) [T vkl? = lakik]? + lakti etl? H larpin] 
y como ||Tvk+1l| = ||T*vk+1l|l, las igualdades (3) y (4) implican que ak+1,k42 = `: = 
ak+1,n = 0 y así en el renglón k + 1 de [T]g todas las entradas son cero excepto a lo más 
por ak+1,k+1- Se sigue que |T]g es diagonal y que los v; son vectores propios de T. 


El ejemplo 8 muestra que para R-espacios vectoriales puede haber operadores norma- 
les que no sean diagonalizables. El teorema espectral para ¡R-espacios vectoriales reempla- 
za la condición de normalidad por la de autoadjunción. Recordemos, del ejemplo 7, que 
todo operador autoadjunto es normal y que el ejemplo 8 es el de un operador normal no au- 
toadjunto; el problema con este ejemplo es que el operador no tiene valores propios reales, 
lo cual por el lema 8.9 no sucede para operadores autoadjuntos. 


Teorema 8.15 (Teorema espectral real). Sea T : V — V un operador lineal en un R- 
espacio vectorial con producto interno. Entonces, V tiene una base ortonormal de vectores 
propios de T si y sólo si T es autoadjunto. 


DEMOSTRACIÓN. Si V tiene una base ortonormal BB de vectores propios de T, entonces 
[T] g es diagonal con entradas reales. Se sigue que [7] ¿ es igual a su transpuesta conjugada 
y por lo tanto T = T*, i.e., T es autoadjunta. 

Supongamos ahora que T es autoadjunta. Por 8.9 el polinomio característico de T' se 
descompone en factores lineales en R y así podemos aplicar el teorema de Schur (7.16) 
para obtener una base ortonormal B de V tal que A = [T] g es triangular superior. Se sigue 
que 


‘A= A = [T*]s = [T]g = A 
(la penúltima igualdad porque T* = T por hipótesis). Así,* A = A y como * A es triangular 
inferior y A es triangular superior, la igualdad A = A implica que A es diagonal y por lo 
tanto B consiste de vectores propios de T. 


Corolario 8.16. Sea T : V — V un operador lineal en un K'-espacio vectorial con 
producto interno. Supongamos que T es autoadjunto si K = R ó que T es normal si 
K = Č. Sean A1,...,Am € K los valores propios distintos de T y sean E, (T) = 
ker(T — A; idy) los espacios propios correspondientes. Entonces, 


d) V = Eh (T) 9- Eyn (T). 


(2) Cada espacio propio E), (T) es ortogonal a los vectores de los otros espacios propios 
Ex, (TD) conkH j. 


DEMOSTRACIÓN. Por los teoremas espectrales, V tiene una base ortonormal de vectores 
propios de T. Así, todo v € V se puede escribir como combinación lineal de estos vectores 
propios de T y por lo tanto 


(t) V = Ex (T) + +E (T). 


Para mostrar que la suma es directa, supongamos que 


(x) 0=W1+:::+m 


con los w; € Ex,(T'). Como los w; corresponden a valores propios A; distintos, por 5.8 
son linealmente independientes y así (x) implica que w; = 0 para todo j y por lo tanto la 
suma (f) es directa. La afirmación (2) es 8.13. 
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8.4. Operadores ortogonales y unitarios 


Si V es un K-espacio vectorial de dimensión finita con producto interno, una ¡sometría 
de V es un operador lineal T : V — V que preserva normas, i.e., tal que |[To|| = [||| 
para todo v € V. 


Ejemplo 10. La rotación Ro : R? — R? por un ángulo 0 es una isometría. 


Ejemplo 11. La homotecia T : V — V dada por Tv = Av, con A € K, es una isometría si 
y sólo si |A] = 1. 


Ejemplo 12. Si A1,..., An € K tienen valor absoluto |A¿| = 1 y si T : V —> V es un 
operador lineal para el cual existe una base ortonormal B = {v1,..., Un} de V tal que 
Tv; = Ajvj, entonces todo vector u € V se puede escribir como 


u = (u, v)u1 + (u, v2)02 + -+ + (U, Un) Un. 
Aplicando el operador T a u se obtiene 
Tu = (uu) Tv +--+ (U, Un) T Un = A (u, v1)01 +- H An (U, 0n)Un- 
Se sigue que 
Tul]? = [Ar (u, vivr? +- H [An (u, Un) 00]? = |u, v)? H + [(u, vn)? = [Jul]? 
ya que |A;| = 1 y |v;| = 1, y por lo tanto T es una isometría. 
Observación. Si T : V — V es una isometría, entonces T es un isomorfismo. En efecto, 


basta ver que T es inyectiva, y para ésto supongamos que Tw = 0; entonces ||v|| = [[Tv|| = 
0, y por lo tanto v = 0. 


Definición 8.17. Sea T : V — V una isometría. Si K = R, se dice que T es un operador 
ortonormal. Si K = C, se dice que T es un operador unitario. 


Teorema 8.18. Sea T' : V — V un operador lineal en un R-espacio vectorial con producto 
interno. Entonces, T es una isometría si y sólo si (Tu, Tv) = (u,v), para cualesquiera 
u,v EV. 


DEMOSTRACIÓN. Es claro que si T preserva productos internos, en particular preserva 
normas. Recíprocamente, si T preserva normas consideremos los dos casos: 


Caso 1. Si K = R; en este caso, mediante una simple expansión del lado derecho, usando 
que (w, w”) = (w”, w), se prueba que el producto interno (, ) satisface la identidad 


(1) (o, w) = E (o + a? — lao — a?) 
y así 
(Tu, Tu) = (Tu + Tol? — [Tu — Tol?) 
= (IT +o- IT- o)l) 
= 2 (lu +v? — ju — vl?) porque [Tw] = [lo 


II 
~ 
£ 

e 
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Caso 2. K = C; en este caso el producto interno (hermitiano) satisface la identidad 
B) (wa) = (lwt wl- o wP) + È llo iwl? — w- — 0?) 
que se demuestra usando la igualdad Im z = Re (—iz), para z = (w, w’): 
Im (w, w’) = Re (—¿(w, w”)) = Re (w, iw”) 
que a su vez implica: 
(w, w) = Re (w, w’) + ¿Im (w, w’) = Re (w, w”) + ¿Re (w, iw’) 


de donde usando ahora la identidad (1) del caso real, se obtiene la identidad (2). 
Finalmente se procede como en el caso 1. 


Las identidades (1) y (2) que se usaron en la demostración anterior, se llaman las 
identidades de polarización para los productos internos real y complejo. 


Teorema 8.19. Sea T : V — V un operador lineal en un R-espacio vectorial con producto 
interno. Las afirmaciones siguientes son equivalentes. 


(1) T es una isometría. 
(2) TT* = idy = T*T. 


(3) Si B = {v1,... , Un } es una base ortonormal de V, entonces {Tw1,..., Tun} también 
es base ortonormal de V. 


DEMOSTRACIÓN. (1) => (2): 
(TT —idy)u, v) = (T*Tu, v) — (u, v) 
= (Tu, Tv) — (u,v) por adjunción 
=0 porque T es isometría y el teorema anterior. 


Ahora, como esta igualdad es válida para todo v (y todo u), se sigue que (T*T' —idy)u = 0, 
para todo u y así T*T = idv, lo cual prueba una de las igualdades de (2). La otra igualdad 
se sigue de la ya probada aplicando ()* 


(2) > (3): Si B =(v1,..., Un } es una base ortonormal de V, entonces 
(Tvi, Tvj) = ((T*Tv;, vj} por adjunción 
= (idy v;, vj} por hipótesis 
= (vi, v5) 
= ði; (delta de Kronecker). 


(3) = (1): Usando el proceso de Gram-Schmidt, sea B = {v1,..., Un} una base 
ortonormal de V. Por la hipótesis (3), (Tv1,..., Tun} es una base ortonormal de V. Sea 
v € V; escribiendo v en términos de la base B se tiene que 


por lo que 


|Tv]? = ÓN (v, vj yo;) 1? = 


j=1 j=1 j=1 


(v, v)? = lloll? 


T 
= 
S 
IS 
S 
l 
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(la penúltima igualdad porque los Tv; son ortonormales) y así T es una isometría. 


La parte (2) del teorema anterior nos dice que toda isometría es un operador normal. 
Más aún, si T es una isometría de V y A € K es un valor propio de T, entonces para 
cualquier vector v propio con valor propio A, como Tv = Av, se tiene que 


[lol] = Pol! = [[Av]| =|Alllol 


y como ||v|| 4 0, entonces |A| = 1; es decir, los valores propios de una isometría T tienen 
valor absoluto 1. Los dos teoremas siguientes caracterizan las isometrías extendiendo la 
observación anterior. 


Teorema 8.20 (El caso complejo). Sea T : V — V un operador lineal en un C-espacio 
vectorial de dimensión finita y con producto interno. Entonces, T es un operador unitario 
si y sólo si existe una base ortonormal de V formada por vectores propios de T y cuyos 
valores propios tienen valor absoluto 1. 


DEMOSTRACIÓN. Supongamos que T es unitario. Como observamos después de la la de- 
mostración del teorema anterior, T es normal. Entonces, por el teorema espectral complejo 
existe una base ortonormal v1,...,v, de V formada por vectores propios de T. Si A; es 
el valor propio correspondiente a vj, por la observación previa al teorema se tiene que 
Aj] =1. 

Supongamos ahora que V tiene una base ortonormal v;,..., Un formada por vectores 
propios de T y cuyos valores propios tienen valor absoluto 1. Por el ejemplo 12, T es una 
isometría, i.e., T es unitario. 


Teorema 8.21 (El caso real). Sea T : V — V un operador lineal en un R-espacio vecto- 
rial de dimensión finita y con producto interno. Entonces, T es un operador ortogonal y 
autoadjunto si y sólo si existe una base ortonormal de V formada por vectores propios de 
T y cuyos valores propios tienen valor absoluto 1. 


DEMOSTRACIÓN. (=>): Como T es autoadjunto, por el teorema espectral real existe una 
base ortonormal v1,..., Un de V formada por vectores propios de T. Si A; es el valor 
propio correspondiente a vj, por la observación previa al teorema anterior se tiene que 
Aj] =1. 

Supongamos ahora que V tiene una base ortonormal v;,..., Un formada por vectores 
propios de T y cuyos valores propios tienen valor absoluto 1. Por el teorema espectral real 
T es autoadjunto y, por el ejemplo 12, T es una isometría, i.e., T es ortogonal. 


Capítulo 9 


Formas bilineales 


OS PRODUCTOS INTERIORES EN IR-ESPACIOS vectoriales son funciones de dos varia- 

bles ( , ) : V x V — R que son lineales en cada una de sus variables (y además 

son positivas definidas y no degeneradas); en este capítulo estudiaremos algunas propieda- 

des de funciones bilineales en general para después enfocarnos hacia el estudio de ciertas 
funciones derivadas de éllas, las formas cuadráticas. 


9.1. Funciones y formas bilineales 


Si K es cualquier campo y V, W y U son tres K-espacios vectoriales, una función 
bilineal es una función 
9: WxW—=>U 
que satisface: 


(1) 9 es aditiva en cada una de sus variables, i.e., 
G) (v +v, w) = (v, w) + (v, w). 
Gi) glv, w +w’) = olv, w) + plv, w’). 

para cualesquiera v, v’ € y w € W 

(2) ¢ġ saca escalares en cada una de sus variables: 
© (v, w) = Ad(v, w). 
Gi) (v, Aw) = (v, w). 

para cualesquiera v € V,w EW y àE K. 


Ejemplo 1. Como observamos al principio, un producto interior en un R-espacio vectorial 
V es un función bilineal 
(,): VxV >R. 


Note que esto no sucede para C-espacios vectoriales en general, porque un producto inte- 
rior (hermitiano) en este caso saca escalares conjugados en la segunda variable. 


Ejemplo 2. Si f,g : V x W — U son dos funciones bilineales, su suma 
+9: VxW >U 
dada por (f + g)(v, w) := f(v, w) + g(v, w), también es bilineal. 


Ejemplo 3. Si f,g : V x W — U es una función bilineal y À € K es un escalar, la función 
A- f: V xW — U, definida por (A - f)(v, w) := Af (v, w), también es bilineal. 


Los dos ejemplos anteriores nos dicen que el conjunto de funciones bilineales 
Bilx(V x W,U) 
es un K-espacio vectorial. 
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En lugar de estudiar funciones bilineales en general, en lo que sigue nos restringiremos 
a estudiar funciones bilineales f : V x W — K con valores en el campo K, que es un 
K-espacio vectorial, por supuesto. 


Ejemplo 4. Si vemos a los vectores de R? como columnas y a una matriz 2 x 2 con coefi- 
cientes en R, dada por sus dos columnas, la función determinante: det : Mat2.2(R) —> R 
la podemos ver como una función de dos variables (las dos columnas de una matriz 2 x 2): 


det : R? x R? > R 
que es bilineal, como probamos en el capítulo 4. Observe que si v, w € R?, se tiene que 


det(v, w) = — det(w, v), por lo que en general, para una función bilineal /, aún cuando 
tenga sentido, la igualdad ¿(u, v) = ġ(v, u) no es válida siempre. 


Ejemplo 5. Si A € Matmxn( K), viendo a los elementos de K” como vectores columna, 
la función 

da: K” x K” >K 
dada por ġ4(v, w) = 'vAw, (que es un escalar, ya que tv es 1 x m, A es m x n y wes 
n x 1), es bilineal, por propiedades del producto de matrices. 


La matriz asociada a una forma bilineal. El ejemplo anterior asocia una forma bilineal 
Da: K” x K” — K a una matriz A de tamaño m x n. Recíprocamente, si V y W 
son dos K-espacios vectoriales de dimensiones finitas m y n, respectivamente, y si A = 
[01,...,Umj y B = {w1,..., Wn} son bases de V y W, dada una forma bilineal f : 
V x W — K, para cualquier par de vectores (v, w) € V x W, escribiendo v y w en 
términos de las bases A y B: 


m n 
y= > Qivi y w= ) Bjw;, 
¿=1 j=1 


se tiene que 


= 5 aig (vi, 5 Byw) linealidad en la primera variable 
= j=1 


n 


= 5 5 aißjo(vi,; wj) linealidad en la segunda variable 


i=1 j=1 
m n 
= $ >D Qibjaij para aij := $(vi, wj) 
i=1 j=1 
Qi t Aln bı 
J lar, , Qm] z 
Am1 TN Amn Bn 


=t[v]aAļw]g para la matriz A = (a;¿) con entradas a;j := (vi, ww). 


Es decir, (v, w) = *[v]4A[w]g y hemos asociado así, a la forma bilineal ¢, la matriz 
A = (aij) de tamaño m x n. Lo anterior se resume en el teorema siguiente: 
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Teorema 9.1. Si V y W son dos K-espacios vectoriales de dimensiones finitas m y n, se 
tiene un isomorfismo de K'-espacios vectoriales 


Bilx(V x W, K) > Matmxn(K). 


DEMOSTRACIÓN. Sólo falta verificar que las funciones definidas antes del teorema son 
lineales e inversas una de la otra. Esto lo dejamos como un ejercicio. 


Diremos que la matriz A asociada a la forma bilineal ¢, representa a la forma bilineal. 
Así, la forma bilineal (v, w) se puede expresar en términos de las coordenadas de los 
vectores [v] 1, [w]g y de la matriz A. 


En lo que sigue, nos restringiremos aún más en el estudio de las formas bilineales, 
para considerar sólo formas bilineales en un sólo K-espacio vectorial 


b:IVxV>oKkK 


a las llamaremos formas bilineales para enfatizar que tienen valores escalares. Así, si V es 
de dimensión finita n, con base A, denotaremos con [b] 4 a la matriz asociada a la forma 
bilineal b con respecto a la base dada, y observamos que ésta es una matriz cuadrada n x n. 

Una pregunta natural, en este contexto, es: ¿si A = [01,...,Un y B=4([w1,..., Wn} 
son bases de V y si [b] 4 y [b]g son las matrices asociadas a la forma bilineal b en las 
bases respectivas, cuál es la relación entre estas matrices?, es decir, cómo se cambia de 
bases? Para responder a estas preguntas, recordemos lo que hicimos para obtener la matriz 
de cambio de bases para un transformación lineal en el capítulo 2: sea Q = [idy]% la 
matriz de cambio de base de 4 a B. Entonces, () es una matriz invertible y satisface que si 
v,w € V y si [v]g, [1] g son sus coordenadas en la base B, entonces sus coordenadas en la 
base A son: 

lola =Qluls y  lwla=Qluls. 

Se tiene entonces que, si A = [b] 4, 


lo], Alw]a =*(Qlo]s) 4(Qlu]s) = [v]a*QAQ|[v]g 


y así, con respecto a la base $, la matriz que representa a la forma b es *Q AQ. Observe 
que, a diferencia del cambio de base para una transformación lineal que cambia a la matriz 
asociada A por Q7! AQ, para el caso de una aplicación lineal en lugar de la inversa de Q 
se usa a la transpuesta de Q. Hemos así probado: 


Proposición 9.2. Sea b: V x V — K una forma bilineal en un K -espacio vectorial V de 
dimensión finita n. Si A y B son bases de V y si A y B son las matrices asociadas a la 
forma b en las bases A y B, respectivamente, entonces, para la matriz de cambio de base 
Q = [idy]§ , se tiene que 


B=*QAQ. 


Lema 9.3. Sea b: V x V — K una forma bilineal en un K-espacio vectorial V de 
dimensión finita n. Sea A la matriz asociada a b en cualquiere base de V. Entonces, A es 
una matriz simétrica (A = A) si y sólo si b(u, v) = b(v, u) para cualesquiera u,v € V. 


DEMOSTRACIÓN. Si b(u, v) = b(v, u) para cualesquiera u,v € V y si B = {v1,..., Un} 
es una base de V, para la matriz A = (a;¿) asociada a b, se tiene entonces que 


Qij = b(vi, vj) = b(vj, vi) = aji 


por lo que la matriz A es simétrica. 
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Recíprocamente, si a;; = b(vi, vj) y A = (aij) es simétrica, entonces b(v;, vj) = 
b(v;, vi) y por lo tanto, para cualesquiera vectores u, v € V, escribiéndolos en términos de 


la base B: [u] = [a,...,an] y [lv] = [81, . - - , Bn), se tiene que 
plu, v) = [u] Alv] 
*(lu] A[v]) ya que *[u] A[v] es un escalar 
to]! 4*[u] 
=*[v] Alu] yaque*A= A y “*[u] = fu] 
= p(v, u) 


Definición 9.4. Una forma bilineal b: V x V — K se dice que es simétrica si p(u, v) = 
ó(v, u) para cualesquiera u,v € V. Así, el lema anterior nos dice que una forma bilineal 
es simétrica si y sólo si la matriz asociada lo es. 


Ejemplo 6. Por supuesto que no toda forma bilineal es simétrica; el ejemplo 4 de la forma 
bilineal det : R? x R? — R no es simétrica ya que det(u, v) = — det (v, u). 


Ejemplo 7. Note que un producto interno en un ¡R-espacio vectorial V es una forma bilineal 
simétrica b = ( , ) que además satisface las propiedades adicionales: 

= Es positivo definido, i.e., b(u, u) > O para todo u € V. 

a Es no degenerado, i.e., b(u, v) = 0 para todo u € V implica que v = 0. 


Observe ahora que la noción de ortogonalidad en un espacio vectorial con producto 
interno sólo requería las propiedades de linealidad, en la primera variable, y simetría bajo 
conjugación del producto interno. Entonces, dado un K -espacio vectorial V con una forma 
bilineal simétrica b : V x V — K, podemos definir una noción de ortogonalidad con 
respecto a la forma bilineal b, diciendo que dos vectores u,v € V son ortogonales si 
b(u, v) = 0. Con este concepto de ortogonalidad es natural preguntarnos si todo K-espacio 
vectorial de dimensión finita con una forma bilineal simétrica tiene una base ortogonal, es 
decir, si el algoritmo de Gram-Schmidt sigue siendo válido. La respuesta es afirmativa y es 
una variación del teorema de Gram-Schmidt. 


Teorema 9.5 (Gram-Schmidt). Sea V un K-espacio vectorial de dimensión finita con una 
forma bilineal simétrica b y supongamos que car K 4 2. Si V 4 {0}, entonces V tiene 
una base ortogonal con respecto a b. 


DEMOSTRACIÓN. Por inducción sobre n = dimx V. Si n = 1, cualquier vector no cero 
de V es una base ortogonal. Supongamos ahora que n > 1. Hay dos casos a considerar: 


Caso 1. Supongamos que para todo u € V se tiene que b(u,u) = 0. Para comenzar, 
observemos que se tiene la identidad de polarización 


b(u, v) = Tou +v, u +0) — b(u, u) — b(v, v)) 


la cual se demuestra simplemente desarrollando el lado derecho; note que aquí se usa que 
car K Æ 2. Por la suposición del caso se tiene que el lado derecho de la identidad de 
polarización es cero. Se sigue que b(u, v) = 0 para cualesquiera u,v € V y por lo tanto 
cualesquiera dos vectores de V son ortogonales, en particular los vectores de cualquier 
base de V. 
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Caso 2. Supongamos ahora que existe un vector vı € V tal que b(v1, v1) = 0. Veremos que 
el algoritmo de Gram-Schmidt se aplica en este caso y para ésto, pongamos V, = K (vı) el 
subespacio unidimensional de V generado por v1. Sea Vt := {w € V : b(v1,w) = 0). 
Claramente Vj} es un subespacio de V y mostraremos que V = Vi ® Vi. En efecto, 
siv € V consideremos el escalar A := b(v,v1)/b(v1,v1) y observemos que el vector 
v— Av] € Vi ya que 


b(vi, v — Avi) = b(v1,v) — Ab(v1,v1) =b(v1,v) — blv v) =0 


y así v = Avı + (v — Avı) € Vi + Vit. Para ver que la suma es directa, note que V, N V 
es un subespacio de V; que no es igual a todo V; ya que si lo fuera se tendría que vı € Vi, 
lo cual no es posible porque b(v1, v1) Æ 0. Se sigue que V, N V = {0} porque V; es 
unidimensional. Hemos así mostrado que V = V, ® V. Ahora, como dim x vo =n-1, 
por hipótesis de inducción existe una base ortogonal de Vj}, digamos va, .. . , Un. Es claro 
que v1, V2, .. ., Un es base ortogonal de V. 


Como una consecuencia de este teorema, observemos que si b es una forma bili- 
neal simétrica en un K-espacio vectorial de dimensión finita con car K 4 2, y si B = 
[v1,...,U, | es una base ortogonal de V, i.e., tal que b(v;, vj) = O para i 4 j, como la 
matriz asociada a b tiene entradas a;¿ = b(v;, vj), entonces a;j = O para i 4 j por lo que 
la matriz A = (a,¿) es una matriz diagonal, digamos 


A= diag(A;), con Ai := lii Z b(vi, vi), 1 < 1 <n. 


Cuando esto sucede, la forma bilineal tiene un aspecto simple: si u,v € V son vectores 
cuyas coordenadas, con respecto a la base B, son [u] = [a1,..., an] y [v] = [b1,.-.,bn], 
entonces 

b(u, v) = à1a1b1 +-+- + Ananda 
y decimos que la forma bilineal b está diagonalizada. Hemos así probado: 
Corolario 9.6. Si b es una forma bilineal simétrica en un K -espacio vectorial de dimen- 


sión finita V y car K # 2, entonces b se puede diagonalizar, i.e, existe una base ortogonal 
de V tal que la matriz asociada a b es diagonal. 


9.2. Formas cuadráticas 


Seguiremos considerando espacios vectoriales sobre campos de característica distinta 
de 2. Si V es un K-espacio vectorial de dimensión finita y si b : V x V — K es una forma 
bilineal simétrica, la forma cuadrática determinada por b es la función 


œ:V >K 


dada por q»(v) := b(v, v). Observe que dada la forma cuadrática q, se puede recuperar a la 
forma bilineal simétrica b usando las identidades de polarización 


(1) b(u,v) = > (ou +v,u+w)-—b(u, u) — b(v, v)) = (alu +v) — qlu) — a(v)) 
y 


(2) d(u,v)= Tou +v,u +v) —b(u—v,u—v)) = ! (a(u +v) — q(u— v)) 


que se demuestran simplemente evaluando el lado derecho. 
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Ejemplo 8. Si V = K” ysib: K” x K” — K es la forma bilineal usual, i.e., para 
u = (2%1,...,Tp) y V = (Y1,---,Yn), blu, v) = Y ziyi, entonces la forma cuadrática 
asociada es 

q(u) = blu, u) = 1? + + x2. 


Ejemplo 9. Si V = K” y si A = (aij) es una matriz simétrica n x n, entonces para la 
forma bilineal asociada b(u, v) := *uAv, la forma cuadrática correspondiente es: 


qalu) = b(u, u) S2 an: 
En particular, si A = diag(A;) es una matriz MA n x n, entonces 


lu) = b(u, u) = Pre 


Note que este ejemplo generaliza el ejemplo 8, que corresponde a la matriz identidad /,,. 
Ejemplo 10. Si V = R? y tu = (x,y), entonces la función 


q(x, y) = 2x? + 3xy + y? 


es una forma cuadrática en R?. La forma bilineal correspondiente está dada como sigue: 
sean u = (11,41) y v = (22, y2) dos vectores de R?. Entonces, usando la identidad de 
polarización (1): 


b(u,0) = 5(a(u+ v) — alu) — alv) =F (alar + 22,11 + yo) — alar y) — alez, 1) 


221 +22) + 3(21 + 29) (y1 + y2) + (y1 + y2)? — (207 + 321Y1 + y?) 


( 
(213 + 312Yo + y2)) 
-al 


3 3 
T]L2 + 37241 + 37192 + Y1y2- 


Otra manera de hacer lo anterior es obtener primero la matriz A asociada a la forma 
bilineal b correspondiente a la forma cuadrática q. Denotemos esta matriz por 


(o) 


(es simétrica porque la forma b lo es). Como q = b(u, u), para u = (x, y) debemos tener 


que qlz, y) = (x,y) (G 2) (3) 


21? + 3xy + y? = ax? + 2bxy + dy? 
por lo que a = 2, b = 3/2 y c = 1 y por lo tanto la matriz A es: 


aT E a 


es decir, 
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y así 


2 3/2 3 3 
Buo) = (enm (aja 20) (ga) T222 + geai + geie + ve 


9.3. Formas cuadráticas sobre R. El teorema de Sylvester 


Existe una rica teoría de formas cuadráticas sobre cualquier campo K (de característi- 
ca distinta de 2) pero en esta parte final nos contentaremos con estudiarlas sobre el campo 
de los números reales. Ahora, como probamos en la sección anterior, toda forma bilineal 
simétrica b en un R-espacio vectorial de dimensión finita n se puede diagonalizar por me- 
dio de una base ortogonal de V. Note sin embargo que a diferencia del caso de un producto 
interno en V, en general no es posible normalizar la base ya que la forma bilineal b no tiene 
que ser positiva definida o no degenerada y así puede suceder que algunos vectores de la 
base ortogonal que tengamos satisfagan que b(u, u) < 0 ó que b(v, v) = 0. 


—1 1 
1 -—1 
forma bilineal simétrica b correspondiente, se tiene que los vectores u = (1,0) y v = (1, 1) 
son base de R? y son ortogonales ya que 


b(u;0)=(1,0) (E E (1) si 


Sin embargo se tiene también que 
b(u,u) = —1 y b(v,v) =0 


por lo que no se pueden normalizar. 


Ejemplo 11. Si V = R? y si consideramos la matriz simétrica A = , para la 


Lo que podemos hacer, en el caso general de un R-espacio vectorial V de dimensión 
finita n y con una forma bilineal simétrica b, es que dada una base ortogonal (con respecto 
a la forma b) B = {v1,..., Un}, reordenando los vectores de la base, si hiciera falta, y 
poniendo c; := b(v;, vi), podemos suponer que: 


C1,-»-,Cp >0 
Col» ++.» <O 
o a A Ó 


Así, p es el número de vectores de la base tales que la entrada diagonal de la matriz 
asociada a la forma b es positiva y t es el número de entradas negativas. Note que p+ t es el 
rango r de la matriz asociada a b y, por la proposición 9.2, si A y B son matrices asociadas 
a la forma b, en las bases A y B respectivamente, entonces B = QAQ, con Q una matriz 
invertible, por lo que el rango de A es igual al rango de B, i.e., el rango no se altera al 
cambiar la base de V y por lo tanto el número ny := n — r, el número de entradas nulas, 
es invariante ante cambios de bases de V. Mostraremos que los números p y t tampoco 
dependen de la base ortogonal B de V escogida. Comenzamos dando otra interpretación 
del entero no: 


Proposición 9.7. Sea V un R-espacio vectorial de dimensión finita n > 0, con una forma 
bilineal simétrica b. Sea Vo el subespacio de V dado por 


Vo:=[wE€EV : b(v,w)=0 para todo v €V}. 


Sea B = [v,,..., Vn } cualquier base ortogonal de V. Entonces, el número ny de vectores 
vi € V tales que b(v;, vi) = 0 es la dimensión de Vo. 
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DEMOSTRACIÓN. Reordenando la base si hiciera falta, podemos suponer que b(v1, v1) Æ 
0, ..., d(v,, Uy) Æ 0 y que b(v;, vi) = 0 para i > r. Ahora, como B es ortogonal se tiene 
que b(v;, vj) = 0 para toda i Æ j, en particular para toda i > r y j < r. Como también 
se tiene que b(v;, vi) = O para ¿ > r, entonces los vectores Vr+1,...,Un están en Vo. 
Mostraremos que generan a Vo. En efecto, si v € Vo es cualquier vector, viéndolo como 
elemento de V lo escribimos en términos de la base B: 


(1) V = 0101 +++ + arUr + arry ++: + Un. 


Ahora, como v € Vọ, se tiene que b(v,v;) = 0, para todo j, por definición de V,. En 
particular, para j < r se tiene que 


(2) 0 = b(v, vj) = ajb(vj, vj) 


(la segunda igualdad se obtiene substituyendo la expresión (1) de v y usando que los v; son 
ortogonales) y como j < r entonces b(v;,v;) 4 O por lo que la igualdad (2) implica que 
aj = 0 para j < r. Se sigue que la igualdad (1) es de la forma 


VU = QAr41Ur41 + *** F An Un 


por lo que v,+1,-. . , Un generan Vo. Finalmente, como son parte de una base de V entonces 
son linealmente independientes y por lo tanto son una base de Vo. 


El número no se llama el índice de nulidad de la forma b y el número r = n — ny se 
llama el rango de la forma. Observe que una forma es no degenerada si y sólo si su índice 
de nulidad es 0, ó lo que es lo mismo, si y sólo si su rango es n. 


Teorema 9.8 (Sylvester). Sea V un R-espacio vectorial de dimensión finita n, con una 
forma bilineal simétrica b. Entonces, existe un entero p > 0 tal que si B = {v1,..., Un} es 
cualquier base ortogonal de V, se tienen exactamente p enteros j tales que b(vj, vj) > 0. 
Es decir, el número de entradas positivas en la diagonal de la matriz asociada a b no 
depende de la base elegida. 


DEMOSTRACIÓN. Sean [v1,...,Un y y [w1,..., Wn ) bases ortogonales de V y suponga- 
mos que están ordenadas de tal manera que 


b(vi vi) > 0si1l<i<p 
b(vi vi) <0sip+1<1i<t 
b(vi, vi) =Osit+1<i<n 


b(wi, wi) >0sil <i < p' 
b(wi, wi) < Osip +41<i<t 
b(w;,w¡) =0si'+1<i<m 
Mostraremos que p = p', probando primero que p < p”. Para ésto, mostraremos 
primero que 
(x) V1) +++) Up, Wp/41)+ ++ Wn 


son linealmente independientes. En efecto, supongamos que se tiene una combinación li- 
neal 


(1) 4101 +-*+ + apUp + bp 41Wp 41 + +++ + bnWn = O. 
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Entonces, 
(2) 4101 +: + apup = —(dy y 1Wp41 +: bnwn) 


y poniendo c; = b(vi, vi) y di = b(w;, wi), aplicando la función bilineal b( , ) a los 
vectores de (2) y usando que los v; y los w; son ortogonales, se obtiene que: 

(3) cia? +-+ Esa = + 10% +1 ++ dyb? 

ya que d; = 0 para ¿ > t' + 1. Ahora, como c1, ... , Cp Son > 0, el lado izquierdo de (3) es 
> 0; similarmente, como d,+1,. . . , dy son < 0, el lado derecho de (3) es < 0. La igualdad 


(3) implica entonces que sus dos lados son 0 y ésto sucede si y sólo si a1 = +++ = ap = 0, 
por lo que la ecuación (1) se vuelve 


bp +1Wp' +1 +--+ bnWwn = 0 
con los w; linealmente independientes porque forman parte de una base. Se sigue que 
bp +1 =+*** = bn = 0 también y por lo tanto los vectores de (x) son linealmente indepen- 
dientes. Ahora, como dimg V = n, entonces el número de vectores de (x) debe ser < n, 
es decir, 

p+(n-p)<n 
y por lo tanto p < p'. Cambiando los papeles de los v; y los w; en (+), por simetría se sigue 
que p’ < p y por lo tanto p = p' como se quería. 


Definición 9.9. Si (V,b) es un R-espacio vectorial de dimensión finita con una forma 
bilineal simétrica b, al número p de entradas positivas en la diagonal de cualquier matriz 
(diagonal) que represente a b, se le llama el índice (de positividad) de la forma b. 

Note que la diferencia entre el rango r y el índice de positividad p es el número de 
entradas negativas en cualquier representación diagonal de b. 

La diferencia s entre el número de entradas positivas menos el número de entradas 
negativas, se llama la signatura de la forma b. 

El teorema de Sylvester dice que el rango r, el índice p y la signatura s de la forma 
b son invariantes de la forma b. Note que el conocimiento de cualesquiera dos de estos 
invariantes determina al tercero. 


Ejemplo x. La forma cuadrática q(x, y) = x? — y? en R?, tiene matriz asociada le 2) ; 


con respecto a la base canónica de R?. Se sigue que el rango de q es r = 2, su índice de 
positividad es p = 1 y su signatura es s = 0. 


9.4. Aplicaciones a la geometría 


Capítulo 10 


Álgebra multilineal 


10.1. Funciones multilineales y el producto tensorial 


Sean V y W espacios vectoriales sobre un campo K. Si L es otro K-espacio vectorial, 
recordemos que una función bilineal p : V x W — L es una función que es K-lineal en 
cada una de sus dos variables, es decir, 


©: p(v1 + va, w) = p(v1, w) + p(vz, w) 
(11): (Av, w) =A: olv, w) 
(111): blu, wi + w2) T (v, w1) T (v, w2) 
Gv): olv, Aw) =A: olv, w) 

para v, v1, v2 E V, w, w1, w2 EW, y àE K. 


El producto tensorial de V y W es un K-espacio vectorial que linealiza en forma 
universal a las funciones bilineales definidas en V x W. En términos precisos, el producto 
tensorial de V con W consiste de un K-espacio vectorial, denotado V &x W, y de una 
aplicación bilineal p : V x W — V & W, que satisface la propiedad universal siguiente: 
Para cualquier otro K-espacio vectorial L y para cualquier aplicación bilineal Y : V xx 
W — L, existe una única aplicación lineal ¿: VOX W>oL que hace conmutar el 
diagrama siguiente: 


V x W—V 8 x W 


$ $ 
L 


Como es usual con objetos definidos por propiedades universales, si el producto ten- 
sorial de dos espacios vectoriales existe, este es único salvo isomorfismo. Para mostrar la 
existencia del producto tensorial de dos espacios vectoriales la construcción es como si- 
gue: Sean V y W dos K-espacios vectoriales y sea M el K-espacio vectorial cuya base es 
V x W. En M consideremos el subespacio vectorial N C M generado por los elementos 
de la forma: 


(3): (vı + v2, w) — (v1, w) — (v2, w) 
Gi: (Av, w) — A(v, w) 

Gii): (v, w1 + wa) — (v, w1) — (v, wa) 
(iv): (v, Aw) — A(v, w) 


y consideremos el espacio vectorial cociente 
V 8x W := M/N, 
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y al epimorfismo canónico 
p:VxW =V 8x W, 
cuya imagen denotamos por p(v, w) := v 8 w. 

Nótese que las relaciones que definen al subespacio N C M son tales que al pasar al 
espacio cociente M/N se vuelven cero y así el epimorfismo p : V x W —= V Ox W es 
entonces bilineal. 

Para ver que V &g W y p satisfacen la propiedad universal del producto tensorial, 
sea p : V x W — L cualquier aplicación bilineal. Defínase $: V g W => L como 
(v Q w) := (v, w). Que q está bien definida es porque si (v, w) € N entonces (v, w) es 
una combinación lineal de los generadores de N, y como 4 es bilineal, entonces se anula 
en estos generadores y así se anula en (v, w). Claramente ó es lineal, hace conmutar el 
diagrama correspondiente y es única con esta propiedad. 

Las propiedades siguientes son inmediatas: 


1: Si V y W son K-espacios vectoriales de dimensiones m y n respectivamente y si 
[e1,...,€m) Y Lf1,..-, fn} son bases de V y W, entonces los mn elementos e, Y f; € 
V8xW,1<1i<m,1< j< mn, forman una base de V &g W. Se sigue que: 


dimx(V Sk W) = dimg V - dim x W. 


2: Si V es cualquier -espacio vectorial, entonces 


V 8g K >V. 


3: Si V y W son K-espacios vectoriales, entonces existe un isomorfismo natural 


V8ƏKW œW 8xgV. 


4: Si U, V, W son K-espacios vectoriales, se tiene un isomorfismo natural 


U8S(VeaW)=(USsV)e w. 


Estas propiedades se prueban fácilmente, por ejemplo para (3) obsérvese que la apli- 
cación $: V x W — W 8 V dada por p(v, w) = w & v es bilineal y así por la propiedad 
universal del producto tensorial induce un único morfismo $: Va W => W 0 Y tal que 
$(v 2 w) = w 9 v. Similarmente se tiene una aplicación lineal 4 : W 9 V > V 9 W tal 
que p(w Q v) = v Q w, y se prueba fácilmente que $ y Y son inversas una de la otra. 


Ahora, usando la asociatividad natural (4) del producto tensorial, si V es un K-espacio 
vectorial podemos considerar, para cada entero n > 1 las potencias tensoriales 


QV :=V 8x --9x V, 
(n factores.) Y para n = 0 se define e V := K. A los elementos T € R” V se les llama 


tensores. 


Tensores alternantes y potencias exteriores. Sea n > 1 un entero y denotemos con 
Sn al grupo simétrico en n letras, i.e., al grupo de permutaciones de un conjunto con n 
letras. Obsérvese que si V es un K-espacio vectorial, entonces el grupo S,, actúa en forma 
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natural en la n-ésima potencia tensorial Q)” V como sigue: Dada cualquier permutación 
o € Sn se tiene un isomorfismo o : Q” V —> Q” V definido por d(v, Y ++: Q vn) := 
Vof) © `+ 8 Vo(un): 

Recuérdese ahora que toda permutación o € S, es el producto de transposiciones, y 
una permutación ø se llama par (respectivamente, impar) si o es el producto de un número 
par (respectivamente, impar) de transposiciones. El signo de una permutación se define 
como 

sen(o) := i i E ASPI 
—1  sicesimpar. 

Un tensor T € Q” V se llama alternante si o(T) = (sgno) - T para todo o € 
Sn. Obsérvese entonces que como el signo de una transposición T es —1, y como toda 
permutación es el producto de transposiciones, entonces un tensor T € Q)” V es alternante 
si y sólo si T(T”) = —T para todas las transposiciones 7 € Sn. 

Siu=u1 8-9 un E Q” V es un tensor alternante y si u; = uj para algún i Æ j, 
entonces u = 0, ya que si T = (i,j) € Sn es la transposición correspondiente, entonces 
u = T(u) = (sgn 7) - u = —u y así u = 0 (si la característica del campo K no es 2). 

En el espacio vectorial Q” V consideremos al subespacio M C Q)” V generado por 
los tensores de la forma u, 9 ---uS--: SUS un. La potencia exterior n-ésima de V 
es el espacio vectorial cociente: 


n n 
Av = ( Q v) /M. 
Sir: Y" V —> A" V es el epimorfismo canónico, para u1 Q +: Y Un E Y” V 
usaremos la notación T(u; Q- -Q Un) =: U1 ^- -^ Un. Con la notación anterior, se tiene: 


1:Siu=u1 A: A Un € A” V y si u; = uj para algún i £ j, entonces u = 0. 
2: En A” V se tiene que 
AAA AU A A Un = A Au A AUA A Un. 


La parte (1) se sigue de la definición de potencia exterior, y para la parte (2) se tiene, 
por (1), que: 
0 = w Ane A (uit uj) AAA (uit uj) AA Aun 
ug Ate AU Aee A (ui Huj) A Aun 
+ wA AUA A (uit uj) AA Un 
= UWA NAUA AUA A Un FUA AUA AU A ++ AU 
+ UA NUJ A NAUA NA Un HUA AUA NNUA AU, 
= WANUNA NUA AU FUA AUJA AUGA AU 


ya que en la penúltima igualdad el primero y el cuarto sumandos son cero por la parte (1). 


Proposición 10.1. Sea V un K-espacio vectorial de dimensión n, y sea {e€1,... , en} una 
base de V. Sea p > 0 un entero. Entonces, 


d) APV = 0 para p >n. 


p 
(2) dimx(A V) = dl = moa para0<p<mn. 
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Una base para N? V está dada por 
Bp = {e RD 7 LE MEE EN 


DEMOSTRACIÓN. Sabemos que el conjunto B = [e;, Q --- 8H ej, : 1 < ij < n} es una 
base para Q” V. 

Como r : QP? V > N? V es suprayectiva y como B genera Q)? V, entonces sus 
imágenes bajo 7, [e;, A+++ ^ei, : 1 < ij < n} generan a A” V. 


(1). Si p > n, para cada generador e;, ^+ ++ ^ ej, de N V existen al menos dos subíndices 
ij = ij con j Æ k y así por la observación (1) previa a la proposición, el generador 
ei, A+: A ei = 0, ie, NP V = 0 para p > n. 


(2). Supongamos ahora que O < p < n y consideremos al conjunto 
Bp = {e A A ei ; Lem <<. ct sn} 


n 


y Obsérvese primero que este conjunto tiene ( ) elementos ya que cada elemento e;, A 


p 
++ Aej, de Bp corresponde a una sucesión de números t1, ... , ip tales quel < 1 < -+ < 
ip < n, i.e., a un subconjunto de [1,..., n} de exactamente p elementos, y el número de 


estos subconjuntos es precisamente G) Así, una vez que mostremos que Bp es una base 


de A? V, se tendrá que dimx (A? V) = HB, = G) Mostraremos que $, es, en efecto, 
una base de A? V. 


G): Bp genera A? V. En efecto, sea v € A” V y sea ú € Q” V tal que r(v) = v. Como B 
es una base de 2)” V, entonces ọ se puede escribir como 


n 


y= > Oir ip Cii S:::9€j, 


i1,- ip=1 


con 05, ..., € K. Y como v = q (0), entonces 


v = 1(0) = X ani Te; 8-9 ei) = Na €n A+++ As, 


de tal forma que si en algún sumando e;, $ -*- Q es, se tuviera que ei, = es, con j Æ k, 
entonces se tendría que e;, ^+: A ei, = 0, por lo que podemos considerar en v sólo 
aquellos sumandos que no tengan esta propiedad. Consideremos entonces al sumando Y de 
U correspondiente: 


p 
D:= Yo ias li, S::: ei € (92) Y. 


Nótese que todavía se tiene que T(%) = v € AP V. 


Cada sumando de % está dado por un conjunto (i1,...,ip) de exactamente p ele- 
mentos, 1 < i; < n. Entonces, existe una permutación o € Sp tal que (ii, to) = 
ao(îi,...,îp) con 1 < it <- < îy < n. 


Entonces podemos escribir a Y como 


v= 5 Qii.ip * Ci BD Dei, 5 5 Qo(î1) o(p) * Coli) B i Y eolâp) 
11 <-<ip 
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y en consecuencia 


v=r(0) = Y s(t1)--o(1p) * eof) N A eol) 
îi <=-<ip 
= X a, és Ases) 
îi <=<ip 


11<--<ip 
= (sgno)- > Qiii Ei A A ei 
i< <p 
= > (sgn o) - ag., Ei A A Ei 
i< <îp 


donde cada es, ^ :-: A ei, € Bp y (sgn 0) : a5,...., € K, y así cada v € N? V es una 
combinación lineal de elementos de B,. 


Gi): B, es linealmente independiente. En efecto, si 
5 Qij- in Ci Ar Aei =0 

i<- <ip 
en A? V, entonces levantando la suma a R” V se tiene que 

i<- <ip 
donde M es el subespacio de 69” V de la definición de A? V. Se sigue que 

SO taei En OD 
ii<- <ip 

donde en cada sumando del lado derecho existen índices s 4 r tales que e;, = ej, por 
definición del subespacio M. 


En particular, todos los generadores del lado derecho son distintos de los generadores 
del lado izquierdo ya que para estos se tiene que 1; < +++ < 2. Así, en QP V se tiene que 


> Dia “Ci, Q-Q Cip a > ds ` Cji Q8 Ci =0 
11<-*<ip 


con generadores distintos entre sí . Y como B = (e, ...ex,) es una base de Q’ V, 
se sigue que todos los as, ....;, = 0 y todos los A = 0 y así B, es linealmente 
independiente. 


10.2. Tensores simétricos 


Bibliografía 


N LA MAYORÍA DE LOS LIBROS que pueblan el bosque de textos de Álgebra Lineal, 
E es tradicional no incluir una bibliografía. Puedo imaginar al menos dos razones para 
esto: una es que posiblemente el autor asume que el tema es muy sencillo y como lo de- 
sarrolla ab ovo no tiene necesidad de referencias externas; otra razón que puedo pensar, y 
creo que aplica a la mayoría de textos comerciales u olvidables, es que no se desea men- 
cionar a la competencia. Olvidando a los olvidables, el autor de estas notas, en forma de 
libro, cree que una bibliografía, aunque mínima, podría orientar al hipotético lector hacia 
otras versiones o enfoques del tema o hacia desarrollos posteriores del mismo. Este autor 
no tiene dificultad alguna en mencionar la influencia de los libros de Lang [4], Bourbaki 
[3] y van der Waerden [6], en su formación. Seguramente algo de estos libros se ha per- 
meado en estas notas. Finalmente, en cuanto a las aplicaciones del álgebra lineal fuera de 
la matemática, el autor reconoce su ignorancia en esto y remite al paciente lector a [5] que, 
fuentes regularmente bien informadas, le dicen que es útil para ello. 
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